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1.  Elnleitung 

1.1  Die  Bedeutunq  der  automatischen  Fokussieruna  fur  die  Bildverarbeitung 

Die  digitale  Bildverarbeitung  hat  sich  in  den  letzten  Jahrzehnten  als  ein  mo- 
dernes  und  wichtiges  Mittel  in  verschiedenen  Gebieten  von  Wissenschaft  und 
Technik  entwickelt.  Als  Beispiele  seien  hier  genannt:  die  Analyse  und  Inter¬ 
pretation  von  Luftbildern  und  Satellitenfotos  in  den  Geowissenschaften,  in  der 
Meteorologie,  der  Astronomie  und  bei  der  Erforschung  von  Naturressourcen,  die 
Analyse  von  optischen  Rontgen-,  Warme-,  radiografischen  und  anderen  Bildern  in 
der  medizinischen  Diagnostik,  bei  der  industriellen  Schadenserkennnung  und  in 
der  wissenschaft! ichen  Forschung  sowie  die  Analyse  von  Abbildungen  der  opti¬ 
schen  und  der  akustischen  Holographie. 

Die  Entwicklung  der  Hardware  (Miniaturisierung  der  Bauteile,  Erhohung  der  Ge- 
schwindigkeit  und  der  Speicherkapazitat  von  Digitalrechnern)  sowie  die  Redu- 
zierung  des  Preises  hat  die  Anwendungen  der  Bildverarbeitung  in  vielen  Gebie¬ 
ten  unseres  Lebens  verstarkt.  Durch  den  Einsatz  von  modernen  Bildverarbei- 
tungssystemen  wurde  nicht  nur  eine  Befreiung  des  Menschen  von  eintoniger  Ar¬ 
beit  erreicht,  sondern  auch  eine  geringere  Fehlerhaufigkeit  und  wesentlich 
hohere  Verarbeitungsgeschwindigkeit  erzielt. 

Fur  die  Bildverarbeitung  ist  es  wichtig,  eine  Produktion  von  Bildern  mit  hoch- 
ster  Qualitat  zu  erreichen.  Die  Bildqualitat  ist  dabei  abhangig  von  vielen 
Faktoren,  z.B.  der  Qualitat  der  Kamera,  der  Beleuchtung  des  Objektes  und  der 
Scharfe  der  Kamera.  Der  Fokussierungszustand  der  Kamera  spielt  die  grofite  Rol- 
le  fur  die  Bildqualitat. 

In  vielen  Situationen  besteht  der  Bedarf  zum  Entwurf  von  einfachen  automati¬ 
schen  Fokussierungsverfahren  fur  die  digitale  Bildverarbeitung:  dort,  wo  ent- 
weder  das  manuelle  Fokussierungsverfahren  nicht  hinreichend  empfindlich  ist 
Oder  wo  die  automatische  Fokussierung  ein  notwendiger  Anteil  des  Bildverarbei- 
tungssystems  ist.  Die  automatische  Fokussierung  begiinstigt  mafigeblich  die  For¬ 
schung. 

ErfahrungsgemaB  wird  die  Fokuseinstellung  mit  steigenden  Anforderungen  an  das 
Auflosungsvermogen  immer  schwieriger,  d.h.  die  Fokuseinstellung  unterliegt 
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starker*  subjektiven  Einflussen  und  apparativen  Fehlern  des  Abbildungssystems, 
so  da8  sie  auch  bei  gleichbleibendem  Beobachter  nur  ungenau  reproduzierbar 
1st. 

Durch  Anwendung  der  digitalen  Bildverarbeitung  entsteht  die  Mdglichkeit,  den 
Informationsgehalt  eines  Bildes  veil  zu  nutzen,  was  bei  visueller  Auswertung 
aus  physiologischen  SrGnden  nur  selten  mdglleh  1st. 

Ein  sehr  wichtiges  Problem  in  der  allgemeinen  Bildverarbeitung  1st  die  Extrak- 
tion  der  Tiefen informal ion  aus  zweidimensionalen  Bildern,  weil  die  Tiefenin- 
formation  des  Objekts  zur  Rekonstruktion  des  dreidimensionalen  Bildes  helfen 
kann  und  schlieBlich  zur  Erkennung  des  Objektes  und  zur  Interpretation  der 
vollstandigen  Szene  fuhrt.  Die  automatischen  Fokussierungsverfahren  konnen 
benutzt  warden,  um  die  Tiefe  des  Objektes  fur  die  dreidimensionale 
Szenenanalyse  herauszufinden. 

Es  gibt  viele  Methoden  zur  Ermittlung  der  Tiefe  eines  Objektes.  Die  traditio- 
nelle  Methode  ist  die  Anwendung  der  Technik  von  optisehen  oder  akustischen 
Abstandsbestimmungsgeraten,  z.B.  Sonar-  oder  Laserabstandsbestimmungsgeraten, 
um  den  Abstand  zwischen  der  Kamera  und  dem  Objekt  direkt  zu  messen.  Diese  Me¬ 
thode  braucht  gesteuerte  Energiestrahlen  (Sender)  und  ein  Gerat  zur  Entdeckung 
der  Ref 1 exi onsstrahl en  (Empfanger);  es  ist  die  sogenannte  direkte,  aktive  Me¬ 
thode,  die  keine  Information  von  Bildern  benotigt. 

Die  relativen  und  passiven  Methoden  zur  Tiefenbestimmung  basieren  auf  dem  Bi Id 
aus  einer  monokularen  Kamera.  Die  typischen  Methoden  sind:  Texturgradient, 
Photometric,  Okklusionsauswirkung,  GroBenbestandigkeit  (size  constancy)  und 
Fokussierungsverfahren. 

Um  die  Tiefe  des  Objektes  durch  Fokussierungsverfahren  zu  bekommen,  wird  die 
Szene  uber  verschiedene  Fokussierungspositionen  analysiert.  Hit  Hilfe  der  au¬ 
tomatischen  Fokussierung  kann  die  bests  Fokussierungsposition  der  Kamera  fur 
das  Objekt  in  der  Szene  gefunden  werden.  Fur  eine  gegebene  Kamera! inse  wird 
die  Tiefe  des  Objektes  allein  durch  die  beste  Fokussierungsposition  festge- 
legt. 
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1.2  Die  Geschichte  der  automati schen  Fokussieruna 

Die  automatische  Fokussierung  hat  man  schon  seit  ca.  40  Jahren  untersucht. 
Hopkins  [1]  hat  im  Jahr  1955  und  Goodman  [2]  im  Jahr  1968  die  Frequenzreaktion 
des  defokalen  opti schen  Systems  theoretisch  analysiert.  Hopkins  hat  das  durch 
ein  defokales  und  aberrationsfreies  optische  System  abgebildete  Bild  einer 
Punktlichtquelle  mit  zwei  Methoden  (Wellenoptik  und  geometrische  Optik)  herge- 
leitet.  Durch  eine  theoretische  Analyse  hat  er  die  Toleranz  fur  die  Defekte 
des  Fokus  vom  opti schen  System  bekommen.  Hopkins  hat  bewiesen,  daB  die  Uber- 
tragungsfunktion  eines  optischen  Systems  durch  eine  GauBverteilung  annahernd 
beschrieben  werden  kann.  Das  defokale  Bild  ist  gleich  der  Faltung  des  richtig 
fokalen  Bi Ides  mit  der  Punktantwort  des  optischen  Systems.  Das  ist  das  theore¬ 
tische  Grundprinzip  der  automatischen  Fokussierung. 

Urn  die  atmospharische  Verzerrung  im  tel eskopi schen  Bild  zu  korrigieren,  haben 
Muller  und  Buffington  [3]  im  Jahr  1974  den  Begriff  des  Scharfenindexes  (SI) 
des  Bildes  aufgestellt 


SI(w)  = 


L  R 

r  r 

3n+mf(x,y,w) 

L  -R 

3xn  3ym 

2 

•dx-dy 


(1.1) 


wobei  f  die  Intensitat  des  Punktes  (x,y)  in  der  Bildebene  ist;  w  ist  die  foka- 
le  Variable  des  optischen  Systems,  die  von  dem  Fokussierungszustand  der  Kamera 
abhangig  ist;  R  und  L  sind  die  Dimensionen  in  der  Bildebene;  n,  m  sind  die 
willkurlichen  positiven  Integrale.  Die  genannten  Autoren  haben  den  Scharfen- 
index  SI (w)  im  Ortsfrequenzbereich  analysiert  und  bewiesen,  daB  die  Funktion 
SI(w)  das  Maximum  in  der  besten  fokalen  Position  des  optischen  Systems  er- 
reicht  und  die  Veranderungsrate  von  SI (w)  in  dieser  Position  Null  ist.  Im  Jahr 
1976  hat  Erteza  [4]  ein  automati sches  Fokussierungssystem  mit  Hilfe  des  Schar¬ 
fenindexes  realisiert.  Dabei  hat  sich  gezeigt,  daB  der  von  Muller  und 
Buffington  aufgestellte  Scharfenindex  fur  das  reale  Fokussierungverfahren  zu 
kompliziert  ist. 

Eine  Methode  zur  Bestimmung  des  optimalen  Fokus  aus  einer  Fokusserie  wurde 
1971  von  Boseck  veroffentl icht  [6].  Bei  diesem  Verfahren  wird  auf  das  zu  pru- 
fende  Bild  mit  Hilfe  einer  1 ichtoptischen  Diffraktionsanlage  die  zweidimensio- 
nale  Fouriertransformation  angewendet,  die  hierbei  auf  der  Fraunhoferschen 
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Beugung  beruht,  Das  Verfahren  baslert  auf  theoretischen  Arbeiten  von  Linfoot 
[7]  und  bewertet  naherungsweise  den  Informat ionsgehalt  des  Bildes.  Es  1st 
zeitaufwendig  und  prinzipiell  nur  fur  fotografische  Bilder  anwendbar. 

Eln  anderes  Verfahren  zur  Bestimmung  des  Optimalfokus  bei  elnem  Lichtmikros- 
kop,  das  wit  elner  Fernsehkamera  arbeitet,  wurde  1976  von  Jarvis  [5]  vorge- 
stellt.  In  dieser  Arbeit  werden  drei  verschledene  Fokusslerungsfunktlonen  ver- 
wendet  und  miteinander  verglichen,  Die  von  Jarvis  aufgestellten  Fokussierungs- 
funktionen  slnd  relativ  elnfach  und  konnen  mit  Analogschaltungen  reallslert 
werden. 

Im  Aufsatz  "A  Comparison  of  Different  Autofocus  Algorithms"  haben  Ligthart  und 
Green  [8]  viele  andere  Fokusslerungsfunktlonen  zusammengefaSt.  Grossmann  [9] 
und  Darrell  [10]  haben  in  ihren  Aufsatzen  fiber  "Depth  from  Focus"  fiber  weitere 
Funktionen  berichtet.  Hit  Hilfe  von  Fokussierungsverfahren  haben  sie  die  Tie- 
feninformation  der  Szene  aus  einem  zweidimenslonalen  Bild  erhalten. 

1.3  Forschunosziele 

Zlel  der  vorliegenden  Arbeit  1st  es,  Verfahren  zu  entwickeln,  die  geeignet 
slnd,  aus  einer  Bildserie  des  gleichen  Objektes  aber  verschiedener  Fokusposi- 
tionen  der  (Camera,  moglichst  fehlerfrei,  die  richtige  Fokusposition  der  (Camera 
zu  finden.  Die  Verfahren  sollen  den  beschrankten  Moglichkeiten  von  re's 
angepaBt  sein.  ifeiterhin  sollen  die  Verfahren  eine  Echtzeit-Verarbeitung 
ermoglichen. 

Die  hier  beschriebene  Vorgehensweise  ist  in  folgende  Phasen  geteilt: 

In  der  ersten  Phase  wird  die  automatische  Fokussierung  mit  acht  verschiedenen 
Fokussierungskriterien  reallslert,  indem  angenommen  wird,  daB  das  Objekt  eine 
ebene  Oberflache  besitzt  oder  die  Schnittdicke  des  Objektes  kleiner  als  die 
Scharfentiefe  der  (Camera  ist.  Das  Fokussierungsprinzip  aller  Fokussierungskri¬ 
terien  wird  theoretisch  analysiert.  Zur  Beurteilung  der  Qualitat  der  verschie¬ 
denen  Fokussierungskriterien  werden  Experimente  durchgefuhrt.  Durch  die  gemes- 
senen  Fokussierungsfunktionen  kann  man  die  Vor-  und  Nachteile  der  einzelnen 
Fokussierungskriterien  herausfinden.  Die  Qualitat  der  Fokussierungskriterien 
wird  nach  folgenden  Aspekten  bewertet: 
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a.  Kompl iziertheit  der  Fokussierungskriterien, 

b.  Rechenzeit  der  Fokussierungsfunktionen, 

c.  Anpassungsvermogen  an  Muster, 

d.  Genauigkeit  der  Fokussierungskriterien, 

e.  Zuverlassigkeit  der  Fokussierungskriterien. 

SchlieBlich  wird  das  beste  Fokussierungskriterium  ausgewahlt. 

Die  zweite  Phase  beschaftigt  sich  mit  der  Fokussierung  zu  einer  relativen  Po¬ 
sition  des  Objektes.  Im  Gegensatz  zur  ersten  Phase  ist  die  Oberflache  des  Ob- 
jektes  jetzt  nicht  mehr  eben.  Ziel  dieser  Phase  ist  der  Entwurf  von  Fokus- 
sierungsverfahren,  mit  denen  die  Kamera  das  Objekt  irgendwo  fokussieren  kann. 

Die  Fokussierung  von  beweglichen  Objekten  ist  die  Aufgabe  der  dritten  Phase. 
Wegen  der  Bewegung  des  Objektes  wahrend  des  Fokussierungsprozesses  sind  die 
verschiedenen  bisherigen  Fokussierungskriterien  wirkungslos,  deswegen  muB  ein 
anderes  Fokussierungsverfahren  gefunden  werden.  In  der  vorliegenden  Arbeit 
wird  ein  zusatzl iches  Lasergerat  benutzt.  Der  Abstand  zwischen  der  Linse  und 
dem  Objekt  kann  mit  Hilfe  der  Koordinaten  des  Laserflecks  in  der  Bildebene 
direkt  berechnet  werden. 

In  der  letzten  Phase  wird  ein  Fokussierungsregelkreis  entworfen.  Dazu  wird  die 
Struktur  der  Fokussierungsregelkreise  zuerst  analysiert  und  dann  das  mathema- 
tische  Modell  entwickelt.  Anhand  dieses  mathematischen  Modells  wird  der  Regler 
des  Systems  entworfen.  SchlieBlich  wird  das  Zeitverhalten  des  geschlossenen 
Fokussierungskreises  untersucht. 
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2.  Theoretische  Grundlagen  der  Fokussierung 
i^L_Pas  Fokussierunosprinzio  des  menschlichen  Auaes 

Unser  subjektiver  Eindruck  1st  so,  daB  wir  unsere  Umgebung  immer  als  scharf 
ansehen,  also  klar  fokussiert.  Dieser  Eindruck  wird  durch  die  praktische 
universale  photograph ische  Tradition,  bei  der  das  Bild  immer  irgendwo  richtig 
fokal  erscheint,  verstarkt.  Aber  leider  sind  diese  photograph ische  Tradition 
und  unser  Eindruck  der  immer  scharfen  Fokussierungswelt  nicht  richtig. 

Wie  in  Bild  2.1  gezeigt,  ist  das  menschliche  Auge  nahezu  kugelformig  mit  einem 
Ourchmesser  von  etwa  24  bis  26  mm  in  der  knochernen  Augenhohle  freibeweglich 
gelagert  und  kann  mit  Hilfe  dreier  antagonist! scher  Muskelpaare  bewegt  werden. 
Unterhalb  der  Lederhaut  liegt  eine  Hembran  (choroid)  mit  vielen  BlutgefaBen 
und  Pigmenten,  die  die  Streuung  des  Lichtes  innerhalb  des  Auges  vermindern 
til]. 


gild  2.1:  Querschnitt  des  menschlichen  Auges. 

Der  vordere  Teil  dieser  Hembran  wird  eingeteilt  in  Strahlenkorper  (Ciliarmus- 
kel)  und  Iris,  die  zusammen  den  Blendenmechanismus  bilden.  Die  Pupille  als 
zentrale  Offnung  der  Iris  hat  einen  variablen  Ourchmesser  zwischen  ca.  8  mm 
bei  Dunkelheit  und  ca.  2  mm  bei  heller  Lichteinwirkung.  Zusatzlich  zur  Reak- 
tion  auf  die  Lichtintensitat  zeigt  die  Gro0e  der  Pupille  auch  verschiedene 
ZustSnde  des  Nervensystems  an  (z.B.  kognitive  und  emotional e  Belastung). 


Bestmdgliche  Kopie 
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Die  am  weitesten  nach  innen  liegende  Membran  ist  die  Netzhaut  (Retina),  auf 
welche  bei  richtiger  Scharfeinstellung  des  Auges  (Akkomadation)  die  Objekte 
der  Umwelt  abgebildet  werden.  In  ihrem  Zentrum  liegt  die  Sehgrube  (Fovea  cen¬ 
tralis),  ein  Winkelbereich  von  etwa  1,5'  mit  der  besten  Auflosung. 

Die  abbildenden  Elemente  sind  die  Hornhaut,  das  Kammerwasser  (zwischen  Horn- 
haut  und  Linse),  die  Linse  und  der  Glaskorper.  Nur  an  der  Grenzflache  zwischen 
Luft  und  Hornhaut  tritt  ein  groBerer  Brechungsindexsprung  von  n  =  1  zu 
n  =  1,38  auf.  Deshalb  liegt  der  Hauptpunkt  H  (Bild  2.2)  nur  ca.  1,5  mm  hinter 


Bild  2.2:  Abbildung  eines  Parallelstrahlbundels  durch  das  Auge: 

F  :  vorderer  Brennpunkt, 

F':  hinterer  Brennpunkt, 

H  :  Hauptpunkt  in  der  Hauptebene  im  Abstand  f'  =  22,8  mm 
von  der  Bildebene, 

K  :  Knotenpunkt  im  Abstand  f  =  17  mm  von  der  Bildebene  und 
im  Abstand  5,8  mm  vom  Hauptpunkt. 

Die  Linse  ist  aus  konzentrischen  Schichten  faseriger  Zellen  aufgebaut  und  ist 
durch  Fasern  mit  dem  Strahlenkorper  verbunden.  Sie  absorbiert  etwa  8  %  des 
sichtbaren  Lichtes  (380  -  780  nm  Wellenlange) .  Im  Unterschied  zu  gewohnlichen 
optischen  Linsen  laBt  sich  ihre  Form  andern  und  zwar  durch  den  Zug  von  Fasern 
des  Ciliarmuskels. 


Bei  der  Fokussierung  auf  weit  entfernte  Objekte  (Abstand  >  3  m) ,  ergibt  sich 
eine  relativ  flache  Linsenform  mit  f  =  17  mm.  Hit  kleiner  werdendem  Betrach- 
tungsabstand  vergroBert  sich  die  Flachenkrummung  und  f  verkleinert  sich  auf 
14  mm.  ,  ‘ 


*  12  - 


Tatsache  1st,  daS  die  auf  der  Netzhaut  abgebildeten  Bilder  ganz  schlecht  fokal 
irgendwo  auBerhalb  der  Sehgrube  sind,  Es  gibt  einen  Gradlenten  des  Fokus.  Der 
Ciliarmuskel  steuert  die  Umdrehung  des  Augapfelsj  damit  kann  das  Bild  von  dem 
interessanten  Objekt  auf  die  Sehgrube  fallen.  Das  Bild  auBerhalb  der  Sehgrube 
ergibt  sich  als  ein  allgemeines  Bild  der  Umgebung,  1st  aber  unscharf.  Wenn  wir 
den  Verlauf  der  visuellen  Achse  betrachten,  wird  deutlich,  daB  die  Lage  der 
Sehgrube  optimal  1st.  Die  Mitte  des  gerade  gesehenen  Bildausschnittes,  d.h. 
was  gerade  fixiert  wird,  fallt  genau  auf  diese  Stelle.  Deshalb  1st  die  optl- 
sche  Achse  auch  der  Ort,  auf  den  sich  die  Aufmerksamkeit  des  Betrachters  ricb- 
tet. 

Bei  der  Netzhaut  lassen  sich  nun  drei  funktional  verschiedene  Schichten  nach- 
weisen,  von  denen  wir  an  dieser  Stelle  nur  den  Bereich  der  Photorezeptoren 
naher  betrachten  wollen,  Zapfchen  und  Stabchen.  Diese  beiden  Photorezeptoren 
wandeln  die  Energie  der  einfallenden  Lichtstrahlen  durch  photochemische  Pro- 
zesse  in  bioelektrische  Impulse  um,  die  wiederum  uber  Schaltneurone  und  den 
Sehnerv  zum  Gehirn  gelangen  und  den  visuellen  Wahrnehmungseindruck  entstehen 
lassen. 

2.2  Die  ootische  Geometrie  der  Kameralinse 

Grundkenntnisse  uber  optische  Systeme  {Linsen,  Blenden  usw.)  sind  unerlaBlich, 
um  die  Auswirkungen  der  optischen  Abbildung  auf  die  notwendige  und  erzielbare 
Bildqualitat  des  Bildverarbeitungssystems  abschatzen  zu  konnen,  Bild  2.3 
stellt  eine  Kamera  mit  einzelner  Linse  dar. 


Bild  2.3:  Schematische  Darstellung  einer  Kameralinse. 
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Der  Abstand  zwischen  dem  Objekt  und  der  Linse  ist  die  Objektweite  p,  ent- 
sprechend  ist  der  Abstand  q  zwischen  der  Bildebene  und  der  Linse  die  Bildwei- 
te.  Die  Objektweite  p  und  die  Bildweite  q  sind  mit  der  Brennweite  f  verbunden. 
Es  gilt  fur  die  diinne  Linse  die  bekannte  GauBsche-Linsengleichung 


Diese  Gleichung  kann  direkt  aus  der  geometrischen  Optik  der  diinnen  Linse  abge- 
leitet  werden.  Die  Lichtstrahlen  durch  das  Linsenzentrum  beugen  sich  nicht, 
wahrend  sich  die  Lichtstrahlen  parallel  zur  optischen  Achse  beugen,  damit  die¬ 
se  Lichtstrahlen  durch  den  Brennpunkt  gehen.  Die  VergroGerung  der  Linse  laBt 
sich  zu 


(2.2) 


bestimmen.  Werden  die  Objektweite  p  und  die  Bildweite  q  mit  einbezogen,  so 
ergibt  sich 


»  -  ?  •  (2-3) 

Haufig  ist  von  Interesse  zu  erfahren,  wie  sich  der  AbbildungsmaBstab  bei  klei- 
nen  Objektverschiebungen  auswirkt.  Bildet  man  aus  Gleichung  (2.1) 
q  =  p*f/(p-f)  und  differenziert  nach  p,  so  erhalt  man  zusammen  mit  Gleichung 
(2.3)  fur  den  TiefenmaBstab 


(2.4) 


Dieser  Zusammenhang  ist  sehr  wichtig  fur  meBtechnische  Anwendungen.  Zeigt  er 
doch,  daB  eine  kleine  Objektverschiebung  in  Achsenrichtung  urn  dp  zu  einer  urn 
den  Faktor  02  groBeren  Bildverschiebung  dq  fiihrt. 

Theoretisch  werden  Linsen  als  1 ichtbrechende  Medien  betrachtet,  ohne  raumliche 
Begrenzungen  mit  einzubeziehen.  Deren  Berucksichtigung  soil  nachfolgend  anhand 
von  Blenden  geschehen,  die  in  den  Strahlengang  eingefuhrt  werden.  Wesentliche 
Vertreter  hierfur  sind  Pupillen  und  Luken.  Die  einfachste  Form  einer  Blende 
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stellt  die  Fassung  einer  Linse  dar,  da  sie  das  in  die  Linse  fallende  LichtbQn- 
del  begrenzt  (Bild  2.4). 


0  Durch  Abbildung  entstandene  Blende  (konjugiert) 

Bild  2.4:  Wirkung  von  Blenden  innerhalb  eines  optischen  Systems. 

Nieht  alle  vom  Objektpunkt  P  ausgehenden  Lichtstrahlen  vermogen  die  Linse  zu 
erreichen.  Nur  die  Lichtstrahlen*  die  die  Blende  passieren,  warden  auch  abge- 
bildet.  Somit  wirkt  diese  Blende  in  ihren  geometrischen  Abmessungen  als  Ein- 
trittspupille  (EP).  Zu  ihr  konjugiert*  als  Abbild  vorliegend,  1st  die  Aus- 
trittspupille  (AP).  Normalerweise  sind  beide  gleich,  d.  h.  EP  =  AP, 

Begrenzen  wir  den  Bereich  des  Objektes,  von  dem  aus  Lichtstrahlen  zur  Abb 11- 
dung  gelangen,  ebenfalls  durch  eine  Blende,  in  diesem  Fall  Eintrittsluke  {EL) 
genannt,  so  wird  klar*  daB  nur  innerhalb  dieser  Luke  liegende  Objektpunkte  zur 
Abb il dung  gelangen.  Die  Eintrittsluke  fuhrt  zu  einer  entsprechenden  Begrenzung 
in  der  Bildebene*  die  durch  ihr  Bild,  die  Austrittsluke  (AL),  gegeben  ist. 
Eintritts-  und  Austrittsluke  sind  ebenfalls  zueinander  konjugiert. 

Allgemein  kann  festgehalten  werden,  daB  die  im  Strahlengang  vorhandene  Aper- 
turblende  als  Pupille  wirkt,  wahrend  die  Feldblende  die  Lukenfunktion  erfullt. 
Luken  und  Pupillen  fallen  niemals  in  einem  Strahlengang  zusammen.  Luken  haben 
die  Funktion  der  Lichtfeldbegrenzung,  wahrend  iiber  die  Pupillen  die  Helligkeit 
der  Abbildung  eingestellt  werden  kann. 

Zur  Kennzeichnung  der  Begrenzung  von  Lichtstrahlen  kann  die  Blendenzahl  BZ 
bzw.  die  numerische  Apertur  N.A.  herangezogen  werden.  Aus  Bild  2.5  sind  diese 
Parameter  berechenbar.  Die  Blendenzahl  BZ  ermittelt  sich  zu 
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BZ  -  i  ,  (2.5) 

wobei  r  der  Durchmesser  der  Kameralinse  ist.  Die  numerische  Apertur  N.A. 
ergibt  sich  allgemeiner  aus  dem  Offnungswinkel  a  zu 

N.A.  *  n-sinar  ,  (2.6a) 

wobei  n  der  Brechungs index  des  Mediums  ist.  Dies  gilt  sowohl  fur  die  Be- 
trachtung  auf  der  Objekt-  als  auch  auf  der  Bildseite,  so  daB  zwischen  objekt - 
und  bildseitiger  numerischer  Apertur  unterschieden  werden  kann.  Bei  der  Kamera 
ist  das  Medium  beider  Seiten  Luft  (n=l);  es  vereinfacht  sich  die  Beziehung 
(2.6a)  zu 


N.A.  -  sino 


(2.6b) 


Bild  2.5:  Bundelbegrenzung  bei  optischen  Systemen. 

Fur  die  Fokussierung  des  Bildes  spielen  die  Scharfentiefe  S.T.  und  die  Fokus- 
sierungstiefe  F.T.  eines  optischen  Systems  eine  wesentliche  Rolle;  S.T.  be- 
schreibt  den  EinfluB  einer  Objektverschiebung  auf  die  Abbildungsscharfe.  Die 
ideal isierte  Kamera  bildet  jedes  Objekt  "scharf"  ab,  unabhangig  von  seiner 
Entfernung.  Bei  einer  realen  optischen  Kamera  mit  einem  Linsensystem  ist  dies 
aus  zwei  Griinden  nicht  der  Fall: 

a.  Die  Scharfe  jeder  optischen  Abbildung  ist  aufgrund  der  Wellennatur  des 
Lichtes  begrenzt. 
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b,  Auf  der  Bildebene  werden  Objekte  aus  nur  einer  Objektebene  mit  bestimmter 
Objektweite  scharf  abgebildet. 

Die  Scharfentiefe  S.T,  1st  der  Abstand  zwischen  dem  nachsten  Punkt  und  dem 
weitesten  Punkt  an?  Objektraum  entlang  der  optischen  Achse,  in  der  alle  Objekte 
“zufriedenstellend"  fokal  sind.  Eine  praktische  Definition  des  "zufriedenstel- 
lender?"  Fokus  kann  auf  dem  geometrischen  Model!,  das  in  Bild  2.6  dargestellt 
1st,  basieren. 


Eine  Punkt! ichtquelle  1st  durch  die  Kameralinse  in  der  Bildebene  als  ein  Un- 
scharf ebereich  abgebildet,  wenn  sie  in?  defokalen  Zustand  1st.  Der  Durchmesser 
dieses  Unseharfebereiches  Au  ist  ein  Had  fur  die  Defokussierung.  Insbesondere 
kann  man  das  Bild  von  der  Punkt! ichtquelle  als  fokal  richtig  ansehen,  wenn  der 
Durchmesser  Au  einen  vorgegebenen  Wert  nicht  (iberschreitet.  Solange  der  Wert 
Au  beispielsweise  kleiner  als  0,1  mm  auf  der  Bildebene  bleibt,  stort  dies 
nicht,  da  das  Auge  die  Punkte,  die  naher  als  0,1  mm  beieinander  liegen,  nicht 
als  getrennt  erkennen  kann. 

In  Bild  2.6  wird  eine  Punktl ichtquelle,  die  zwischen  Pj  und  pg  an  der  opti- 
schen  Achse  liegt,  zwischen  q1  und  q2  im  Bildraum  fokal  abgebildet.  In  dieser 
Tiefe  ist  der  Durchmesser  des  Unscharfebereichs  kleiner  als  0,1  mm;  Pj  und  p2 
definieren  die  weiteste  und  nachste  Objektebene. 
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Pj  und  konnen  als  Funktionen  von  p,  f,  Au  und  dem  Durchmesser  der  Linse  r 
ausgedriickt  werden.  Die  Herleitung  basiert  auf  einfachen  geometrischen 
liber! egungen.  Aus  der  Ahnlichkeit  des  Dreiecks  im  Bildraum  ergibt  sich 


Au  q'ql  q2~q 

r  "  qi  '  qz  * 

Setzt  man  (2.1)  in  (2.7)  ein,  so  folgt 


(2.7) 


Au  ,  Prf-P-f  . 

r  =  Pj-p-Pj-f  “  p2-p-p2*f  ' 

Aus  Gleichung  (2.8)  kann  man  dann  Pj  und  pg  berechnen.  Man  erhalt 


(2.8) 


_  _  p-r-f _ 

P1  "  r-f  -  Au-(p-f) 


n _ Elllf _ 

p2  r-f  +  Au- (p-f)  ’ 

Die  gewiinschten  Ergebnisse  folgen  somit  unmittelbar: 
weiteste  Tiefe  D1  -  P]  -  p  =  r.fU;p^[p?f) 
nachste  Tiefe  D2  -  p  -  p2  -  r.fU;PAi- (p-f) 

S.T.  =  D1  +  D2 


‘  _  2-p-r-f-Au- (p-f) 

r2-f2  -  Au2- (p-f)2  ’ 

Die  Bedeutung  dieser  Gleichungen  fur  unsere  Zwecke  ist: 


(2.9a) 

(2.9b) 


(2.10a) 

(2.10b) 

(2.10c) 


a)  Die  Scharfentiefe  S.T.  wird  in  dem  Made  abnehmen  wie  der  Durchmesser  der 
Linse  zunimmt.  Es  kommt  darin  der  anschauliche  Sachverhalt  zum  Ausdruck, 
dad  die  Scharfentiefe  mit  kleiner  werdendem  Durchmesser  der  Linsenapertur 
anwachst.  Urn  die  Scharfentiefe  des  optischen  Systems  zu  erhohen,  kann  man 
den  Durchmesser  der  Linse  verkleinern,  aber  eine  Kamera  mit  zu  kleiner 
Linsenapertur  absorbiert  nicht  genug  Strahlen.  Deshalb  ist  die  Auswahl 
des  Durchmessers  der  Linse  ein  Kompromid  zwischen  der  Scharfentiefe  und 
der  Fahigkeit  zur  Absorbierung  der  Energie.  Die  Apertur  des  menschlichen 
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Auges  1st  zehnmal  kleiner  als  die  einer  guten  Kamera,  entsprechend  1st 
die  Scharfentiefe  zehnmal  groBer. 

b)  Die  Scharfentiefe  S.T.  nimmt  ab,  wenn  die  Brennweite  der  Linse  zunimmt. 
Diese  Tatsache  kann  man  durch  die  Umschreibung  der  Linsengleichung 
einfach  verstehen 

(p-f)-(a-f)  -  f2  •  <2-n) 

Diese  Gleichung  ist  in  Bild  2,7  gezeichnet. 


Bild  2,7:  Schematische  Darstellung  der  Linsengleichung. 

In  diesem  Bild  sind  beide  Achsen  auf  f  normiert.  Die  Bildweiten  qj  und  q2 
entsprechen  einem  willktirlichen  Interval!  der  Objekttiefe  in  der  Objektebene, 
z,B,  10  mm  und  20  mm.  Hit  einer  1  mm-Linse  (f=l)  liegen  diese  Tiefen  an  der 
horizontal en  Asymptote  des  Bildes.  So  besteht  ein  unbedeutender  Unterschied 
zwischen  der  q-Koordinate  und  ihrer  jeweilig  besten  Bildebene,  Aus  dieser 
Situation  ergibt  sich  eine  breite  Scharfentiefe.  Nun  wird  die  Auswirkung  einer 
4  mm-Linse  betrachtet.  Die  zu  fokussierenden  Punkte  liegen  ebenfalls  zwischen 
10  mm  und  20  mm.  Diese  beiden  Tiefen  befinden  sich  an  der  normierten  Achse  bei 
2,5  bzw,  5  und  produzieren  einen  sehr  groBen  Unterschied  an  q-Koordinaten 
(weil  die  q-Achse  auch  durch  f  normiert  ist).  Daraus  resultiert,  daS  eine 
gleichzeitige  Fokussierung  dieser  beiden  Punkte  sehr  schwer  ist.  Die  Fo- 
kussierungstiefe  F.T.  fuhrt  die  gestattete  Toleranz  in  der  Bildebene,  bei  der 
das  Bild  eines  Objektes  mit  bestimmter  Objektweite  in  einem  akzeptablen  Fokus 
bleibt,  zuruck.  In  Bild  2,8  ist  der  Abstand  F.T.  der  Fokussierungstiefe  fur 
einen  gestatteten  Durchmesser  des  Unscharfebereichs  Au  gezeichnet. 
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Bild  2.8:  Definition  der  Fokussierungstiefe. 


Aus  dem  Bild  kann  man  ersehen,  daB  dieses  Interval!  symmetrisch  zur  besten 
Fokussierungsebene  liegt.  Es  ist 

F.T.  =  — = -  .  (2.12; 

Fur  p  »  f,  also  q  a  f,  ergibt  sich 


F.T.  a  .  (2.12b) 

Die  Fokussierungstiefe  miBt,  wie  scharf  die  beste  Bildebene  im  Bildraum  defi- 
niert  ist.  Sie  ist  ein  brauchbares  Kriterium  zur  Festlegung  der  Genauigkeit 
von  automatischen  Fokussierungskriterien.  Durch  die  o.g.  Analysen  kann  man 
sehen,  daB  die  beste  Fokussierung  durch  die  Veranderung  der  Objektweite  oder 
der  Bildweite  erreicht  wird. 


2.3  Die  Theorie  der  Defokussierunq 

Der  Begriff  Bild  bezieht  sich  auf  eine  zweidimensionale  Funktion  der  Lichtin- 
tensitat  und  ist  mit  f(x,y)  oder  g(x,y)  bezeichnet.  Der  Wert  f(x,y)  fur  die 
Ortskoordinaten  (x,y)  bezeichnet  die  Intensitat  (Helligkeit)  des  Bildes  an 
diesem  Punkt.  Weil  das  Licht  eine  Form  von  Energie  ist,  muB  f(x,y)  zwischen 
Null  und  Unendlich  liegen,  also 


0  <  f (x,y)  <  <jd 


(2.13) 
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Das  Bild,  das  wir  jeden  Tag  visue11  wahrnehmen,  besteht  aus  dem  Reflexions- 
licht  des  Objektes.  Der  Wertebereich  der  Bildfunktion  f(x,y)  ergibt  sich  aus 
dem  Produkt  der  Beleuchtungsstarke  i(x,y)  und  des  Reflexionsgrades  der  aufge- 
nommenen  Objekte  1{x,y) 


f(x,y)  -  i(x,y)*l(x»y)  , 

(2.14) 

wobei 

0  <  i(x,y)  <  as 

(2.15a) 

und 

0  <  l(x,y)  <  1 

(2.15b) 

sind. 

Die  61 ei chung  (2.15b)  bedeutet,  daS  der  Reflexionsgrad  l(x,y)  durch  0  (totale 
Absorption)  und  1  (totale  Reflexion)  begrenzt  1st.  Die  Funktion  i(x,y)  1st 
durch  die  Beleuchtungsquelle  bestimmt,  und  l(x,y)  hangt  von  den  Eigenschaften 
des  Objektes  in  der  Szene  ab.  Die  Intensitat  eines  monochromen  Bildes  an  den 
Koordinaten  (x,y)  wird  als  Grauwert  dieses  Bildes  an  diesem  Punkt  bezeichnet. 

Fur  eine  bestimmte  Szene  sind  die  maximalen  und  minimalen  Objektleuchtedichten 

t  und  L  .  proportional  zur  oberen  und  unteren  Grenze  der  Grauwerte.  Hit  a 
max  nnn 

als  Proport ionalsfaktor  ist 

0  i  a-Lm1n  *  f'x,y)  <  a-Lmax  .  (2-16) 

Diese  Grenzen  bestimmen  den  Grauwertbereich.  Ublicherweise  transformiert  man 
diesen  Bereich  in  einen  Bereich  [0tA]»  wobei  schwarz  gleich  Null  und  weiB 
gleich  A  angenommen  wird.  Fur  die  Verarbeitung  im  Digitalrechner  mussen  die 
unabhangigen  Variablen  (x,y)  und  die  Grauwerte  f(x,y)  digital isiert  werden. 
Nach  einer  aquidistanten  Digitalisierung  in  L  Zeilen  und  R  Spalten  erhalt  man 
eine  Matrix 

F  =  jf(x,y)J  mit  x  »  0,  1,  Z,  ....  L  ■  1  » 

und  y  =  0,  1*  2,  . R  -  1  » 

deren  einzelne  Elemente  als  Bildpunkte  bezeichnet  werden.  Fur  die  entsprechen- 
den  quantisierten  Grauwerte  gilt 


0  <  f(x,y)  <6-1 
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Es  1st  giinstig,  die  Zahl  der  Quantisierungsstufen  als  ganzzahlige  Potenzen  der 
Zahl  zwei  zu  wahlen 

L  =  R  =  2n  und  G  <=  2m  . 

Die  Qualitat  eines  SchwarzweiBbildes  wird  in  guter  Naherung  durch  ein  ent- 
sprechendes  512  x  512  Digitalbild  mit  256  Graustufen  erreicht,  d.h.  n  =  9  und 
m  -  8. 

Die  optische  Abbildung  wird  als  ProzeB  einer  Signalubertragung  aufgefaBt,  bei 
der  das  optische  (abbildende)  System  die  Rolle  eines  Frequenzfi Iters  spielt. 
Diese  Beschreibungsweise  ist  eine  vollstandige  Analogie  zur  Ubertragung  elek- 
trischer  Nachrichten  durch  Frequenzfilter,  wo  die  Nachricht  eine  Funktion  nur 
der  Zeit  und  nicht  des  Ortes  ist. 

Die  optische  Abbildung  als  ein  allgemeines  zweidimensionales  System  H  {Bild 
2.9)  bildet  ein  Eingangsbild  f(x,y)  eindeutig  auf  ein  Ausgangsbild  ab 

9(x,y)  =  H{f (x,y))  .  (2.17) 


f(x,y) 

g(x,y) 

Bild  2.9:  Allgemeines  2-D  System. 

Besondere  Bedeutung  haben  lineare  Systeme.  Das  System  H  ist  genau  dann  linear, 
wenn  bei  jeder  Linearkombination  von  zwei  Eingangsbildern  fj(x,y)  und  f2(x,y) 
die  Systemreaktion  des  Summenbildes  darstellbar  ist  als  dieselbe  Linearkombi¬ 
nation  der  Systemreaktion  auf  die  Einzelbilder,  d.h.,  wenn 


H{aj-fj(x,y)  +  a2-f2(x,y)>  =  a1-H{fj(x,y)}  +  a2-H{f2(x,y))  (2.18) 
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gilt,  wobei  a^  und  a^  Konstanten  sind, 

Im  weiteren  sei  die  6-Funktion  6(x-x%y-y'}  eine  Punktlichtquelle  in  der 
Objektebene  am  Ort  (x,y)  *  (x%y'),  Aus  dieser  6-Funktion,  die  jewel  Is  linear 
unabhangige  Punktlichtquellen  darstellen  kann,  lassen  sich  durch  lineare 
Superposition  beliebig  geformte  Eingangsbilder  aufbauen,  also 


+£Q  +ffl 

f(x,y)  =  j  |  ftxSy'MCx-x'^-y'j-dx'-dy'  ,  (2.19) 

-to  "CD 

wobei  f(x#,y*)*dx# *dy#  als  Gewichtsfunktion  fur  die  5-lichtquellen  aufgefaflt 
werden  kann.  Das  der  Funktion  f(x,y)  entsprechende  Eingangsbild  ergibt  sich 
durch  lineare  Superposition  der  Bilder  der  einzelnen  Punktlichtquellen  im 
Objektraum. 

Die  Linearitatsbedingung  (2, IS)  bedeutet  im  Falle  der  Abbildung  einer  Punkt- 
lichtquelle  in  ein  Punktbild  (Punktantwort) ,  daB  eine  Veranderung  des  Ein- 
gangsbildes  urn  den  Faktor  a  eine  Veranderung  des  Ausgangsbildes  um  den  glei- 
chen  Faktor  hervorruft,  DarQber  hinaus  wird  die  Obertragung  dieses  Bildes 
nicht  gestort  durch  die  gleichzeitige  Abbildung  anderer  Objektpunkte,  d.h.  es 
gibt  keine  Interaktion  der  verschiedenen  parallelen  iibertragungswege.  Bei  rein 
optischen  Abbildungssystemen  sind  diese  Bedingungen  fur  vollstandige  Inkoha- 
renz  oder  Koharenz  der  Wellen  immer  erfullt.  Es  ergibt  sich  das  Ausgangsbild 
des  optischen  Systems  gemaG  Bild  2.9  zu 

m  a 

g(x,y)  -  H{  |  |  f(x\y')-5(x-x',y-y')-dx'.dy'}  ,  (2.20a) 

— ED  -CD 

oder 

w  w 

g(x,y)  -  J  J  f(x',y')-H{S(x-x\y-y')>-<lx'-dy'  (2.20b) 


Der  zweite  Faktor  von  (2.20b),  der  redifiniert  ist  als 


h(x,y,x',y')  =  H<*(x-x'ty-y'))  , 


(2.21) 
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ist  die  Punktantwort  des  optischen  Systems.  Setzt  man  die  Punktantwort  in 
(2.20b)  ein,  so  ergibt  sich 


<n  od 

g(x,y)  -  J  J  f(x',y')-h(x,y,x\y')-dx'-dy'  .  (2.22) 

-OD  -OD 


Neben  der  Linearitat  wurde  noch  eine  weitere  Eigenschaft  an  das  optische  Sy¬ 
stem  gestellt,  namlich  die  Verschiebungsinvarianz  der  Punktantwort.  Um  diesen 
Begriff  zu  erklaren,  wird  eine  Punktl ichtquelle  im  Ursprung  betrachtet,  also 
f(x,y)  =  6(0,0).  Aus  der  angenommenen  Rotationssymmetrie  des  optischen  Abbil- 
dungssystems  folgt,  daR  auch  die  Punktantwort  h(x',y')  Rotationssymmetrie  be- 
sitzen  muB.  Verschiebt  man  die  Punktl ichtquelle  an  eine  Stelle  (x',y'J  unter- 
schiedl ich  von  (0,0),  so  verschiebt  sich  die  Punktantwort  ebenfalls  in  der 
Bildebene.  Durch  die  Bedingung,  daG  sich  die  Gestalt  der  Punktantwort  durch 
Verschiebung  nicht  andert,  ist  die  Punktantwort  nur  von  der  Differenz  der  Ko- 
ordinaten  x  -  x'  und  y  -  y'  abhangig,  also 

h(x,y,x',y')  =  h(x-x\y-y')  .  (2.23) 

In  der  Praxis  sind  die  Linearitat  und  die  Verschiebungsinvarianz  des  optischen 
Systems  in  globaler  Form  nicht  erfullbar,  z.B.  ist  die  Punktantwort  nie  iiber 
der  ganzen  Bildebene  stationar.  Da  sie  sich  aber  als  Funktion  des  Ortes  nur 
langsam  (stetig)  andert,  sind  sogenannte  Isoplanasiebezirke  angebbar,  in  denen 
die  Verschiebungsinvarianz  naherungsweise  Geltung  hat.  Die  Eigenschaften  der 
optischen  Ubertragung  werden  allerdings  damit  zu  einer  Funktion  des 
untersuchten  Isoplanasiebezirkes. 

Gegenuber  der  Linearitat  sind  ebenfalls  ernste  Vorbehalte  anzubringen.  Die 
lineare  Uberlagerung  von  Intensitaten  setzt  namlich  die  vollige  Inkoharenz  der 
beteiligten  Lichtwellen  voraus. 

Wenn  das  optische  System  die  Bedingungen  (2.18)  und  (2.23)  erfullt,  dann  folgt 
die  Beziehung 


00  00 

9(x,y)  =|  J  f(x',y').h(x-x',y-y').dx'-dy' 

-00  "CD 


=  f(x,y)*h(x,y) 


(2.24) 
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Das  Superpositionsintegral  (2.22)  verwandelt  sich  zu  der  Faltungsoperation 
(2.24). 

Ganz  analog  zur  Fouriertransformation  einer  nicht  periodischen  eindimensiona- 
len  Zeitfunktion  wird  die  Fouriertransformation  eines  Bildes  f(x,y)  mit  den 
beiden  unabhangigen  Ortskoordinaten  x  und  y  definiert  durch 


as  m 

F(u*v)  =  |  J  f(x,y)*exp(-2?r*j*(u*x+v*y))*dx*dy  .  (2.25) 

-ns  -m 


Im  allgemeinen  ist  F(u,v)  eine  komplexe  Funktion  von  Ortsfrequenzen  u  und  v 
mit  einem  Realteil  Fr(u,v)  und  einem  Imaginarteil  F.(u,v): 


mit 


und 


F(u,v) 

-  Fr(u,v)  +  j*F^(u»v) 

|F(u,v)| 

-  J[C^(u»v)  +  f((u»vJ] 

_irFi(u*v)  I 

#{u,v) 

"  tan  LFr(u,v)  j 

F(u»v)  heiBt  Frequenzspektrum  von  f(x,y)  und  |F(u,v)|  das  Fourierspektrum  von 
f(x*y);  #(u*v)  ist  der  Phasenwinkel  von  f(x,y),  |F{u»v)|2  =  F2(u»v)  +  F?  (u,v) 
ist  das  Leistungspektrum  des  Bildes. 


Wegen  der  Eigenschaften  der  Fouriertransformation  ergibt  sich  die  Fourier¬ 
transformation  des  Faltungsintegrals  (2.24)  zu 

G(u,v)  =  F(u,v)‘H(u,v)  ,  (2.26) 

mit 

OS  CD 

G(u,v)  =||  g(x,y)*exp(-27t*j«(U‘X+v*y)5*dx.dy 
-as  -m 

und 

cd  so 

H(u,v)  =  |  J  h(xty)*exp(-2jr*j-£u-x+v.y))*dx-dy  . 

-03  "DO 
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Die  Fouriertransformation  der  Punktantwort  H(u,v)  wird  als  die  optische  uber- 
tragungsfunktion  (OuF)  bezeichnet.  Der  Betrag  |H{u,v)j  ist  als  Modulations- 
Qbertragungsfunkti on  (MUF)  (englisch:  Modulation  Transfer  Function)  bekannt. 

Urn  einen  Zusammenhang  zwischen  den  Eigenschaften  eines  optischen  Systems  und 
seiner  OUF  zu  finden,  wird  vorerst  die  Punktantwort  bestimmt.  Die  Abbildung 
des  optischen  Systems  wird  dazu  zunachst  vom  Standpunkt  der  Wellenoptik  aus 
behandelt.  Einfach  gesagt,  die  Defokussierung  eines  inkoharenten  optischen 
Systems  verursacht  die  Unscharfe  des  Bildes.  Es  ist  moglich,  daB  die  Defokus¬ 
sierung  als  eine  Wellenaberration  behandelt  wird.  Diese  Aberration  wird  durch 
die  optische  Obertragungsfunktion  OUF  dargestellt.  Fur  die  Herleitung  werden 
reduzierte  Koordinaten  gemaB  Bild  2.10  benutzt. 


Bild  2.10:  Schematische  Darstellung  des  optischen  Systems, 

0',0:  Objekt-  und  Bildebene, 

E',E:  Eintritts-  und  Austrittspupille. 

Die  kleinen  Buchstaben  sind  reduzierte  Koordinaten,  die  zu  den  entsprechenden, 
durch  GroBbuchstaben  gekennzeichneten,  geometrischen  Koordinaten  gehoren.  Fur 
Bild-  und  Objektebene  definiert  man 


n-sina  v 

„/  _  n'-sina'  v, 

X 

n-sina  w 

9 

x  -  A  -X  , 

(2.27) 

_  n'-sina'  w 

A  ’Y 

> 

y  -  A  -Y  , 

mit  den  numerischen  Aperturen  n-sina  bild-  und  n'-sina'  objektseitig.  Mit  den 
Pupillenhohen  h  und  h'  definiert  man  weiter  die  reduzierten  Pupillenkoordina- 
ten 
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f 


Z 

h 


V 


H 

h  * 


r 


(2.28) 


Es  folgt  f  -  f'  und  t}  =  bei  VernachlSssigung  der  Verzeichmmg. 


In  Eintrltts-  und  Austrittspupille  werden,  wie  in  Bild  2.10  gezeigt*  Referenz- 
spharen  mit  den  Zentren  0*  und  0  gelegt.  Die  Wellenfront  (*=  Flache  konstanter 
Phase)  einer  von  0*  ausgehenden  Lichtwelle  hat  ini  Falls  eines  idealen  Systems 
im  Bildraum  wieder  die  Form  einer  Kugelwelle*  die  in  den  Punkt  0  einlauft.  Bei 
Systemen  mit  Aberration  treten  Abweichungen  W{f,n)  von  der  Kugelform  auf* 
entsprechend  bei  den  auf  die  Austrittsreferenzsphare  bezogenen  Phasen 
k*W{f,r?).  Hit  den  Amplituden  der  Lichterregung  a{f,r?)  kann  man  die  der  Refe- 
renzsphare  zugeordnete  Pupillenfunktion 


b{f,f?)  =  aCf,r?)*exp(j*k*W(f»i?)) 


(2.29) 


definieren,  Sie  hat  die  Pupillenflache  f2  +  t}2  <  1  oder  Z2  +  H2  <  h2  als 
Trager.  Fur  die  praktische  Anwendung  in  der  OOF-Berechnung  betrachtet  man  den 
LichtfluB  durch  die  Austrittspupille  als  homogen  und  setzt 


a(f  **?} 


1  fur  r2  +  n1  <  1 
0  sonst 


{2.30) 


Die  Kenntnis  der  Pupillenfunktion  b(f ,t?)  geniigt,  urn  die  Lichtamplitudenvertei- 
lung  hj(x»y)  in  der  Bildebene  zu  ermitteln  {Bild  2.11). 


y 


h,(x,y) 

o 


Bild  2.11:  Pupillenfunktion. 


-  27  - 


Jeder  Punkt  auf  der  Referenzsphare  kann  als  Ausgangspunkt  einer  Kugel welle 
p-exp(-j-k-r) 

betrachtet  werden.  Man  erhalt  das  Beugungsintegral 

fc,(x.»)  ■ «.}  f  ,  (2.3i) 

“00  -CD 

wobei  c  eine  Konstante  ist.  Fur  das  kleine  Gebiet  in  der  Gegend  der  optischen 
Achse,  in  dem  hj(x,y)  wesentlich  von  0  verschieden  ist,  kann  der  Nenner  als 
konstant  angesehen  und  zur  Konstanten  hinzugeschlagen  werden.  Der  Exponent  ist 
entwickelbar  und  man  erhalt 

r  «  R  -  ^jp{r-x+ij-y)  (2.32) 

in  reduzierten  Koordinaten  mit  k  =  2-Jt-n/X  (Wellenzahl  im  Bildraum).  Setzt  man 
(2-32)  in  (2-31)  ein,  erhalt  man  das  bekannte  Fraunhofer7 sche  Beugungsintegral 

OD  00 

hj(x,y)  =  Cj-J  J  b(f,ij)-exp(+j-2*-(f.x+i7.y))-df.di;  ,  (2.33) 

-m  *od 

wobei  Cj  =  c-exp(-j-R)  ist,  und  weiter  die  Intensitat  h(x,y)  der  Punktantwort 

h(x,y)  =  hj(x,y)-h*(x,y)  .  (2.34) 

Die  berechnete  Ampl itudenverteilung  (2.33)  kann  nach  der  Pupillenfunktion 
aufgelost  werden  und  man  erhalt 

W  0D 

b(f,r?)  =  c2-j  |  hj(x,y) •exp(-j-27r- (x*f+y-rj))*dx-dy  ,  (2.35) 

“CD  "CD 

wobei  c2  eine  komplexe  Konstante  ist. 

Die  Pupillenfunktion  ist  also  proportional  zur  Fouriertransformation  der 
Ampl  itudenverteilung  hj(x,x)  in  der  Punktantwort.  Ferner  ist  wegen  (2.34)  die 
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OUF  proportional  zur  Fouriertransformation  der  Intensitatsverteilung  h(x,y). 
Hit  dem  Faltungstheorem  wird 


OD  ffl 

H{u,v)  =  c-J  |  b(f,i?)*Mf-u,??-¥)*df*dfj  ,  (2.36) 

~SB  -ID 


wbei  u  und  v  wieder  geeignete  Ortsfrequenzen  sind. 

Wegen  der  endlichen  Trager  von  b{f,i?)  ist  eine  Verschiebung  des  Koordinaten- 
netzes  zulassig,  Han  erhalt  so  die  symmetrische  Form  der  obigen  Gleichung 


OD  CD 

H(u»v)  =  c*J  J  b(f+|,jj+|)*b  (r-|,ij-|)*df*di]  .  (2.37) 

-ID  -SB 


Die  Gleichung  (2.37)  ist  das  sogenannte  Duffi eux- Integral ;  sie  gibt  den  Zusam 
menhang  zwischen  der  Pupillenfunktion  und  der  OOF  an.  Die  OUF  ist  die  Autokor 
relation  der  Pupillenfunktion.  Die  Integration  in  (2.37)  ist  nur  scheinbar 
uber  einem  unendlichen  Gebiet  durchzufiihren,  praktisch  erstreckt  sie  sich  nur 
uber  den  Durchschnitt  S  der  um  ±  (u/2,v/2)  gescherten  Trager  A  der  Pupillen¬ 
funktion  (Bild  2.12). 


Bild  2.12:  Region  der  Integration  fiir  die  Ortsfrequenzen  (u,v). 

Fur  ein  aberrationsfreies  optisches  System  in  der  Anwesenheit  einer 
Defokussierung  hat  die  Pupillenfunktion  die  Form 

rexpU-k'.WgQ-CfV))  fur  f2  +  n2  <  1  > 


b(C.n)  - 


0 


sonst 


(2.38) 
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k'  ist  eine  Konstante,  w2Q  ist  eine  Funktion  von  a  und  Aq. 

Wie  Bild  2.13  zeigt,  ist  die  Funktion  w2Q  die  optische  Weglange  des  Abschnitts 
zwischen  der  realen  Wellenfront  und  der  Referenzsphare.  Das  Zentrum  der  realen 
Wellenfront  ist  die  fokale  Bildebene  0Q.  Das  Zentrum  der  Referenzsphare  ist 
die  reale  Bildebene  0.  w2Q  stellt  den  Fokussierungsdefekt  des  optischen  Sy¬ 
stems  dar.  Wenn  das  optische  System  richtig  fokussiert,  uberlappen  sich  die 
Referenzsphare  und  die  Wellenfront.  Wenn  zwischen  der  realen  Bildebene  und  der 
fokalen  Bildebene  eine  Verschiebung  Aq  auftritt,  ist  der  Fokussierungsdefekt 
w2q  durch  folgende  Gleichung  gegeben 

1  2 

W2Q  =  2‘n'sin  a‘A(l  •  (2.39) 


Bild  2.13:  Messung  des  Fokussierungsdefektes. 

Wenn  man  die  Pupillenfunktion  (2.38)  in  die  Gleichung  (2.36)  einsetzt,  ist  die 
Frequenzreaktion  direkt  durch  den  Grad  der  Defokussierung  gegeben.  Die  OUF  des 
optischen  Systems  kann  als  eine  Potenzreihe  in  Bessel -Funktionen  dargestellt 
werden.  Die  durch  die  Wellenoptik  erhaltene  OUF  ist  sehr  kompl iziert.  In  der 
Praxis  wird  die  OUF  aus  der  geometrischen  Optik  heraus  abgeleitet. 

GemaB  der  geometrischen  Optik  ist  die  Punktantwort  innerhalb  des 
Unscharfebereichs  annahernd  konstant  (12] 

-4  for  x2  +  y2<^ 

tt-Au*  ‘  4 

0 


h(x,y)  = 


sonst 


(2.40a) 
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Wegen  der  Diffraktion,  der  Aberration  der  Llnse  und  anderen  Auswirkungen  wird 
die  Punktantwort  besser  als  eine  zweidimensionale  GauB-Verteilung  dargestellt 

h(x,y)  »  -J-j-expt-  .  (2-«b) 

2n a£  2 a£ 

Im  mathematischen  Sinn  ist  a  die  Streuung  der  GauB-Verteilung.  Hier  1st  a  aber 
der  Ausdehnungsparameter  des  optischen  Systems,  namlich 

o  *  k*Au  .  (2.41a) 

k  ist  eine  positive  Konstante,  die  von  der  Eigenschaft  des  optischen  Systems 
abhangig  ist,  Durch  eine  einfache  Rechnung  kann  man  Au  bestimmen.  Han  erhalt 

iu  »  r-q-4  -  |  -  i)  .  <2-41b) 

Von  (2.40b)  kann  die  OUF  des  optischen  Systems  hergeleitet  werden.  Es  folgt 

H(u,v)  =  exp{-  i*(u2+v2)*o2)  .  (2.42) 

Die  OUF  H(u,v)  kann  als  ein  TiefpaBfilter  behandelt  werden.  In  Polarko- 
ordinaten  pS  ergibt  sich  aus  (2.42) 

H{ pm  =  exp{-  |>p2*o2)  ,  (2.43) 

mit 

P  - 

p  ist  die  Grtsfrequenz  in  Polarkoordinaten.  Der  Ausdehnungsparameter  a  ist 
proportional  zum  Grad  der  Defokussierung.  Bei  guter  Fokussierung  besitzt  das 
optische  System  ein  kleines  o,  im  Gegensatz  dazu  hat  ein  reales  optisches  Sy¬ 
stem  ein  groBes  a. 

In  Bild  2.14  kann  man  sehen,  daB,  wenn  a  *=  0  ist,  die  OUF  wie  ein  AllpaBfilter 
arbeitet.  Das  aufgenommene  Bild  ist  ein  perfekt  fokales  Bild.  Wenn  a  zunimmt, 
wird  die  OUF  im  hohen  Frequenzbereich  schnell  abnehmen.  Das  Bild  ist  durch  die 
Defokussierung  unscharf  geworden. 
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cr=0,00 
a=0,05 

CT  =  0,10 

cr=0.20 

P 

10 

Bild  2.14:  Schematische  Darstellung  der  0UF. 

Fur  ein  lineares  verschiebungsinvariantes  System  ist  das  Ausgangsbild  g(x,y) 
durch  die  Faltung  des  Eingangsbildes  mit  der  Punktantwort  gegeben.  Das  Ein- 
gangsbild  kann  man  als  ein  richtig  fokales  Bild  behandeln  und  das  Ausgangsbild 
als  ein  defokales  Bild. 

Bild  2.15  zeigt  die  Auswirkung  der  Defokussierung  am  Profil  einer  idealen  Kan- 
te.  Der  Ubergang  der  defokalen  Kante  ist  Au. 


— H  Au  f— 


Profil  der  Profil  der  Profil  der 

idealen  Kante  defokalen  Punktantwort  defokalen  Kante 

Bild  2.15:  Auswirkung  der  Defokussierung. 

Durch  die  obige  Analyse  wird  deutlich,  daB  der  Unterschied  zwischen  dem  foka- 
len  und  defokalen  Bild  im  hohen  Frequenzbereich  liegt.  Die  Leistungsspektren 
im  hohen  Frequenzbereich  sind  deshalb  ein  MaB  fur  die  Defokussierung. 
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2.4  Die  Qualitatsbewertunq  optischer  Bilder 

Die  Produktion  von  Bildern  mit  hochster  Qualitat  1st  die  naturliche  Anforde- 
rung,  die  ein  Fotograf  stellt.  Die  Bildqualitat  ist  aber  eine  subjektive 
Schatzung.  Es  ist  unmoglich,  daB  die  Bildqualitat  als  eine  einfache  Funktion 
der  physikalischen  Variablen  betrachtet  wind,  Weil  die  Struktur  des  photo- 
graphischen  Bildes  durch  verschiedene  physikalische  Variablen  gekennzeichnet 
ist,  ist  die  Vorhersage  der  Bildqualitat  ohne  Einschrankungen  unmoglich.  L.M, 
Bibermann  [12]  hat  das  Problem  gut  formuliert. 

"In  general  the  concept  of  image  quality  does  not  emerge  until  we  have  defined 
some  tasks  for  the  system  to  perform;  such  tasks  do  not  necessarily  have  to  be 
performed  by  the  components.  Definition  of  the  imaging  task  is  a  vital  part  of 
image  evaluation.  The  more  limited  and  precisely  defined  we  can  make  the  task, 
the  more  accurately  can  the  performance  of  the  system  be  evaluated;  the 
converse  is  also  true." 

Fur  den  Zweck  der  automatischen  Fokussierung  wird  angenommen,  daB  der  einzige 
Faktor  zur  Beeinflussung  der  Bildqualitat  die  Scharfe  des  optischen  Systems 
ist. 

U.  Pfenninger  [13]  hat  festgestellt,  daB  die  Beurteilungswerte  der  Bildquali¬ 
tat  und  der  Scharfe  des  Bildes  eine  Linearkombination  bilden 

V*o  +  v*.  ■  (2-44! 

wobei  $  der  Skalierungswert  fur  die  Bildqualitat  ist  und  $s  der  Skalierungs- 
wert  fur  die  Scharfe  des  Bildes,  aQ  und  a£  sind  zwei  Konstanten,  Das  bedeutet, 
daB  die  Bildqualitat  linear  abhangig  von  der  Scharfe  des  Bildes  ist.  Normaler- 
weise  ist  die  Scharfebeurteilung  eine  Funktion  der  OUF,  und  zwar 


* 


s 


.MM 

s  (-c* 


+ 


(2.45) 


K$,  Bs  und  c  sind  Konstanten.  Die  Gleichung  {2.45}  gilt  fur  die  Bedingung,  daB 
die  OUF  eine  Symmetric  zum  Ursprung  der  Ortsebene  besitzt.  In  diesem  Fall  ge- 
nugt  zur  Beschreibung  die  Angabe  der  ebenfalls  rotationssymmetrischen  OUF  mit 
einer  einzigen  Ortsfrequenzkoordinate  bzw.  die  Beschreibung  in  Polarkoordina- 
ten. 
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Vi  el e  Kriterien  der  Bi 1 dqual i tat  basieren  auf  der  Ubertragungsfunktion  des 
optischen  Systems  und  des  menschlichen  Auges,  weil  die  Qualitat  des  vom  opt i - 
schem  System  aufgenommenen  Bildes  durch  das  menschliche  Auge  beurteilt  wird. 

a.  SMT  {System  Modulation  Transfer  Acutance) -Scharfe 

Die  al teste  Messung  der  Scharfe  durch  die  OOF  wurde  von  E.M.  Grane  [8]  schon 
im  Oahr  1964  vorgeschlagen.  Die  Messung  der  Bildqualitat  basiert  auf  der 
Hypothese,  da(3  alle  Punktantworten  der  GauBverteilung  genugen.  Die  OUF  ist 
in  diesem  Fall  auch  die  GauBverteilung.  Die  Flache  unter  der  Funktion  H(p) 
ist  proportional  zu  1/a2.  Zusammen  mit  dem  Ausdehnungsparameter  des  visu- 
ellen  Systems  a^  kann  man  eine  Messung  der  Bildqualitat  bekommen.  Die  soge- 
nannte  SMT-Scharfe  ist  dann  definiert  als 

°D 

SMT-Scharfe  =  K  +  k-log(~)  ,  (2.46) 

wobei  K,k  Konstanten  sind. 

b.  CMT  (Cascaded  Modulation  Transfer  Function) -Scharfe 

Die  CMT-Scharfe  von  R.G.  Gendron  [15]  ist  in  Bild  2.16  gezeigt. 


Bi 1 d  2.16:  Definition  der  CMT  Scharfe. 
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Die  OOF  des  optischen  Systems  H(/j)  1st  mit  der  OUF  des  visuellen  Systems 
V(p)  kaskadiert.  Die  OUF  vom  kompletten  System  1st  dann  H(/>)*¥(p)  im  Bild 
2,16c,  Fur  die  Referenz  R(p)  =  1  1st  die  Kaskadierung  mit  ¥(/>}  gleich 
R *¥(/>),  Die  CMT-Scharfe  1st  darm  definiert  durch 

CMT-Scharfe  =  K  +  k*log*A/AR  .  (2.47) 

A  1st  die  Flache  unter  der  Funktion  H{p)*V(p)  und  AR  die  Flache  unter  der 
Funktion  R*¥{p), 

c.  Das  Signal -zu-Rauschverhaltnis  (SNR)-Kriterium 

Das  SNR-Kriterium  1st  von  C.N.  Nelson  [14]  vorgeschlagen  worden.  In  diesem 
Kriterium  sind  die  Faktoren  zur  Beeinflussung  der  Bildqualitat  nicht  nur 
die  OUF  H{p}  und  V(p),  sondern  auch  das  Wienerspektrum  des  gesamten  Bild- 
rauschens  W (p),  Zur  Definition  von  SNR  1st 

N(f)  =  - 2 - 1/2  *  C2*48) 

<b(p)  *  (WU)  -  VZ(p)+n)}1/Z 

wobei  b(p)  die  kritische  Bandbreite  des  Rauschens  und  n  der  Term  fur  das 
Rauschen  des  Auges  1st.  Das  SNR-Kriterium  lautet  dann: 

SNR-Kriterium  =  I-  *  {2.49} 

fcR 


mit 


E 


und 


Sf  P) 

N(P) 


d  P 


,  wenn  H{p)  =  1 


{2.50} 


Weil  alle  o.g,  Kriterien  im  Ortsfrequenzbereich  erklart  sind,  muS  das  Bild 
zunachst  in  diesen  Bereich  transformiert  werden.  Diese  Transformation  ist 
die  Hauptschwierigkeit  bei  der  Berechnung.  Um  dieses  Problem  zu  vermeiden, 
sind  weitere  Kriterien  der  Bildqualitat,  die  direkt  von  der  Punktantwort 
Oder  der  Grauwerte  des  Bildes  abhangig  sind,  vorgeschlagen  warden.  Der 
Scharfenindex  (1.1)  ist  ein  typisches  Kriterium  dieser  Art. 
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Die  Eigenschaften  des  zweiten  Moments  von  der  Punktantwort  als  ein  Krite- 
rium  fur  die  Bildqualitat  sind  seit  vielen  Jahren  untersucht  worden.  Das 
zweite  Moment  der  Punktantwort  lautet 

CD  CD 

M2  “  I  1  (xV)-h(x,y)-dx-dy  .  (2.51) 

-CD  -CD 

Das  zweidimensionale  Problem  kann  auf  das  eindimensionale  Problem  reduziert 
werden,  wenn  man  die  Integration  in  zwei  Teile  auftrennt.  Es  wird  ein  Tei 1 
als 

OD 

Mx2  =  |  x2- 1 (x) -dx  , 

-CD 

definiert,  wobei 

OD 

1 (X)  =  J  h(x,y).dy 

-OD 

die  Linienantwort  (Englisch:  Line  Spread  Function)  langs  der  x-Achse  ist. 
Das  zweite  Moment  ist  dann  gegeben  durch 

M2=Mx,2  +  Hy,2  •  <Z-52> 

mit 

CD 

My>2  *  \  y2'Ky)*dy 

-m 

und 

CD 

l(y)  -  |  h(x,y)-dx 

“CD 

als  entsprechende  Antwort  langs  der  y-Achse. 
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3.  Automatische  Fokussierungsalgorithmen 
3,1  Anforderunaen  an  Fokussierungsfunktionen 

Die  Grundidee  der  automat ischen  Fokussierung  fiir  die  Kamera  ist  die  Suche  nach 
einer  Fokussierungsfunktion  (FF),  die  nur  von  den  Grauwerten  des  durch  die 
Kamera  aufgenommenen  Bildes  abhangig  ist.  In  dem  wirksamen  Bereich  der  Kamera 
[p^,pp  1st  die  Fokussierungsfunktion  eine  unimodulare  Kurve  (Bild  3.1).  In 
der  besten  Fokussierungsposition  p'pt  erreicht  die  Fokussierungsfunktion  einen 
extremen  Wert.  In  der  Nahe  von  p^pt  verandert  sich  die  Fokussierungsfunktion 
im  allgemeinen  sehr  schnell. 


Bild  3.1:  Schematische  Darstellung  einer  FF. 

Wegen  der  Wichtigkeit  der  Fokussierungsfunktion  fiir  das  automatische  Fokussie- 
rungssystem  werden  die  folgenden  Kriterien  zur  Auswahl  und  Beurteilung  der  Fo¬ 
kussierungsfunktion  benutzt. 

a.  Unimodulare  Eigenschaft  der  Fokussierungsfunktion 

Die  Fokussierungsfunktion,  auf  der  der  Fokussierungsalgorithmus  basiert, 
muG  unimodular  sein.  Das  heiBt,  daS  nur  ein  einziges  Maximum  Oder  Minimum 
in  der  Fokussierungsfunktion  auftreten  darf.  Oiese  Bedingung  vereinfacht 
den  Algorithmus  betrachtlich  und  vermeidet  die  potentiellen  Fokussierungs- 
fehler  von  lokalen  Extrema. 

b.  Riehtigkeit  der  optimalen  Fokussierungsposition 

Das  Extrum  muB  genau  in  der  richtigen  Fokussierungsposition  der  Kamera  auf¬ 
treten. 
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c.  Reproduktionsfahigkeit  der  FF 

Das  Extremum  der  Fokussierungsfunktion  muB  irgendwann  in  der  richtigen 
Fokussierungsposition  auftreten.  Normalerweise  fuhrt  eine  scharfe  Spitze 
des  Extrems  zur  guten  Reproduktionsfahigkeit. 

d.  Die  Breite  des  wirksamen  Bereiches  [p',p£] 

Die  Breite  des  wirksamen  Bereiches  [p^p^l  mul?  so  groB  wie  moglich  sein, 
damit  die  Kamera  im  groBen  Fokussierungsbereich  arbeiten  kann. 

e.  Allgemeine  Anwendungsfahigkeit 

Die  Fokussierungsfunktion  muB  sich  nicht  auf  einige  besondere  Arten  von 
Bildern  beschranken. 

f.  Unempfindlichkeit  gegeniiber  anderen  Parametern 

Wenn  sich  wahrend  des  Fokussierungsprozesses  andere  Parameter  verandern,  z. 
B.  die  Blendenzahl  der  Kamera  oder  die  Beleuchtungsstarke,  sollte  der  Fo- 
kussierungsprozeB  nicht  durcheinander  gebracht  werden. 

g.  Videosignal kompatibil itat  der  FF 

Die  Fokussierungsfunktion  muB  auf  dem  gleichen  Videosignal,  das  als  Ein- 
gangssignal  fur  die  Bildverarbeitung  benutzt  wird,  basieren. 

h.  Einfachheit  der  FF 

Die  Fokussierungsfunktion  muB  so  einfach  wie  moglich  und  die  Rechenzeit  der 
FF  so  kurz  wie  moglich  sein. 

Die  Defokussierung  eines  optischen  Systems  kann  folgendermaBen  modelliert  wer¬ 
den:  Im  Ortsbereich  ist  ein  defokales  Bild  durch  die  Faltung  des  gleichen  Bi 1  - 
des  im  richtigen  Fokus  mit  der  Punktantwort  des  optischen  Systems  dargestellt. 
Im  Ortsfrequenzbereich  ist  das  Frequenzspektrum  eines  defokalen  Bildes  iden- 
tisch  zur  Multi  pi ikation  des  Frequenzspektrums  vom  gleichen  fokalen  Bild  mit 
der  optischen  Ubertragungsfunktion.  Wenn  ein  Bild  defokussiert  ist,  nehmen  die 
Leistungsspektren  im  hohen  Frequenzbereich  ab,  die  scharfen  Kanten  im  Bild 
werden  verschliffen  und  die  kleinen  Objekte  verlieren  den  Kontrast  im  Bild. 
Deshalb  kann  man  die  Fokussierungsfunktionen  entweder  durch  die  Messung  der 
Leistungsspektren  des  eingegebenen  Bildes  im  hohen  Frequenzbereich  oder  durch 
die  Messung  des  Kontrastes  oder  durch  die  Messung  der  Gradientenfunktion  der 
Grauwerte  bekommen. 
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In  der  vorliegenden  Arbeit  werden  folgende  Fokussierungsfunktionen  ausgewahlt 
und  realisiert. 

3.2  Die  Varianz  der  Grauwerte  als  Fokussierungsfunktion 

Die  Varianz  der  Grauwerte  von  einem  Bild  6  =  [g(x*y)3  suit  L  Zeilen  und  R  Spal* 
ten  1st  eine  KenngroBe,  die  eine  Aussage  iiber  den  (Contrast  im  Bild  zulaBt.  Die 
Varianz  VAR  1st  definiert: 


,  L-l  R-l  7 

VAR  =  n*  £  £  [g(xfy)-m  ]  , 

"  x=0  y=0  9 


{3.1} 


wobei  nig  der  Mittelwert  der  Grauwerte  von  G  ist.  Er  berechnet  sich  gemaB 
L-l  R-l 

m  =  A*  £  £  g{x,y)  .  (3.2) 

9  M  x=0  y=0 

M  =  L»R  ist  die  Anzahl  der  Bildpunkte  von  G.  Zur  einfacheren  Berechnung  der 
Grauwerte  laBt  sich  (3.1)  durch  die  Anwendung  der  binomischen  Forme!  umformen 
auf: 


,  L-l  R-l  r  o  21 

=  A*  £  £  g(x,yr  -  2m  *g(x,y)  +  m  » 
n  x=0  y=0  L  M  3J 

,  L-l  R-l  ?  Hm  L-l  R-l  j  L-l  R-l  - 

■  !  g(x,y)2  -  if  •  E  £  s(x.y)  +  r-  \  s  »g 

n  „ _q  y_Q  11  x=0  y=0  M  x=0  y=0  3 


VAR 


W  S 


x=0  y=0 

L-l  R-l 
£  £ 
x=0  y=0 

L-l  R-l 


x=0  y=0 


£  g{x,y)  -  »; 


2m  L-l  R-l 
£ 

y= 

2 


(3.3) 


Es  ist  intuitiv,  daB  die  hohere  Varianz  dem  Bild  mi t  der  besseren  Scharfe  ent- 
spricht,  wahrend  die  niedrigere  Varianz  dem  unklaren  Bild  entspricht.  Das 
heiBt,  daB  die  Fluktuation  der  Grauwerte  eines  fokalen  Bildes  groBer  als  die 
von  einem  defokalen  Bild  ist.  Zur  Erklarung  der  Beziehung  zwischen  der  Defo- 
kussierung  und  der  Varianz  kann  man  das  Histogramm  der  relativen  Haufigkeit 
von  G  benutzen. 
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Entsprechend  den  fundamentalen  Annahmen  der  Informationstheorie  sind  Bilder  im 
Rahmen  von  Verarbeitungsaufgaben  als  Elemente  eines  statistischen  Ensembles  zu 
betrachten.  Zur  statistischen  Beschreibung  von  Bildern  kann  man  die  klassi- 
schen  Methoden  und  Model le  der  Theorie  des  Zufallsprozesses  verwenden.  Vom 
Standpunkt  dieser  Theorie  aus  ist  ein  Bild  durch  seine  eindimensionale  Wahr- 
scheinlichkeitsdichte  statistisch  vollstandig  beschrieben,  d.  h.  durch  die 
Wahrscheinl ichkeit,  mit  der  das  Bild  in  ein  gegebenes  Volumenelement  des  Sig¬ 
nal  raumes  fallt  [15]. 
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i»„  .  E(2)  -  l  g-pq  ,  <3-6> 

s  g=0  a 

und  die  Varianz  der  Grauwerte  von  1  1st 

255 

VAR  -  E[(2-E(Z))2]  -  S  [g-E(2)r-p„  .  <3*7> 

g-0  3 

Eine  SchStzung  von  E(Z)  und  E[(Z-E(2))2]  ist  durch  das  Histogram  realisier- 
bar,  namlich 

255 

m  =  E{2)  =  £  g*p(g)  .  ^3*8> 

9  g=0 

VAR  =  E[(2-E{2))2]  =  2£5  Cg-ma)2*p{g)  •  (3*9> 

g=G  y 

Bild  3.2  zeigt  das  Profil  einer  idealen  Kante  langs  der  x-Achse  und  sein 
Histogramm.  In  Bild  3.2a  ist  die  Kamera  richtig  fokussiert,  im  Bild  tritt  ein 
Grauwert sprung  auf.  Das  Histogramm  besteht  aus  zwei  5-Funktionen.  Im  Fall  der 
besten  Fokussierung  ist  das  Histogramm 

p(g)  =  0,5* [6{g-a)  +  &{ g-b)] 

Der  Mittelwert  und  die  Varianz  sind 
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In  B11d  3.2c  hat  die  Kante  durch  Defokussierung  zum  Verschleifen  des  Grauwer- 
tesprungs  gefuhrt.  Das  Histogramm  laBt  sich  durch  folgende  Gleichung  darstel- 
len 


0  g  <  a 

(0,5-|f)-«(g-a)  g  .  a 

P<9)  -  a  <  9  <  b 

(0,5-^)-«(9-b)  g  -  b 

0  g  >  b 


Man  kann  den  Mittelwert  und  die  Varianz  von  dieser  defokalen  Kante  durch 

mg2  »  °,S-(a+b)  , 

VAR2  -  0,25- (b-a)2  -  gf(b-a)2 

bekommen.  Es  ist  klar,  daB  die  Varianz  der  defokalen  Kante  YAR2  kleiner  als 
die  der  fokalen  Kante  VARj  ist.  Normal erweise,  wenn  sich  der  Fokussierungszu- 
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stand  verschlechtert,  wird  Ax  sich  vergroBern,  An  VARg  kann  man  dann  bemerken, 
daB  die  Varianz  sich  verkleinert, 

Bei  einem  Bild  mit  reichem  Kontrast  1st  vor  allem  das  Histogramm  p(g)  fur  Wer- 
te  von  g  1m  breiten  Bereich  besetzt.  Das  Bild  hat  elne  groBe  Varianz,  Im  Ge- 
gensatz  balm  Bild  mit  wenig  Kontrast  konzentriert  sich  das  Histogramm  p(g)  in 
der  N§he  des  Hittelwertes.  Das  Bild  besitzt  eine  klelne  Varianz. 

3.3  Die  Entrooie  der  Grauwerte  als  Fokussierungsfunktlpn 

Die  Entropie  1st  ein  MaB  des  mittleren  Informat ionsgehalts  eines  Bildes.  Venn 
das  Bild  als  eine  empfangene  Nachricht  (message),  die  die  Information  uber  das 
Objekt  liefert,  betrachtet  wird,  kann  man  die  Bildqualitat  nach  der  Informa- 
tionstheorie  von  Shannon  auswerten.  Die  Grundidee  laBt  sich  folgendermaBen 
charakterisieren: 

Jede  Nachri chtenquel 1 e  (Geber)  sendet  energetische  Signal e  iiber  eine  Obertra- 
gungskette  an  den  Empfanger.  Der  Empfanger  1st  im  weitesten  Sinne  nicht  ein 
physikalisches  Gerat,  sondern  ein  Sinnesorgan  des  Beobachters.  Jeder  Geber  1st 
imstande,  eine  bestimmte  Anzahl  von  Nachrichten  zu  Obertragen,  er  besitzt  ei- 
nen  mittleren  Informationsgehalt,  Das' gleiche  gilt  fur  den  Empfanger,  der 
ebenfalls  nur  eine  bestimmte  Anzahl  von  Nachrichten  aufnehmen  kann  (mittlerer 
Informationsgehalt  des  Empf angers).  Der  mitt! ere  Informationsgehalt  bezieht 
sich  also  nicht  auf  die  etwa  zu  einem  bestimmten  Zeitpunkt  vom  Geber  ausge- 
sandten  Oder  vom  Empfanger  aufgenommenen  Nachrichten,  sondern  auf  die  maximal 
moglichen  Nachrichten.  Der  die  Verbindung  zwischen  Geber  und  Empfanger  her- 
stellende  Obertragungskanal  kann  nur  eine  bestimmte  Anzahl  von  Nachrichten 
weiterleiten;  er  besitzt  eine  ObertragungskapazitSt. 

Bei  der  re chnerischen  Erfassung  der  Nachri chtenubertragung  kann  man  die  Entro¬ 
pie  benutzen.  Voraussetzung  ist  dabei  allerdings,  daB  die  Nachrichten  eine 
stochastische  Menge  bilden.  Dazu  gehort,  daB  jede  einzelne  Nachricht  durch 
ihre  Wahrscheinlichkeit  gekennzeichnet  ist.  Der  Informationsgehalt  einer  Ein- 
zel nachricht  ist  um  so  groBer,  je  geringer  seine  Haufigkeit  ist.  Diese  Forde- 
rung  erscheint  durchaus  plausibel,  wenn  man  bedenkt,  daB  der  Wert  einer  Nach¬ 
richt  mit  ihrer  Seltenheit  steigt.  Der  mittlere  Informationsgehalt  des  Senders 
(oder  auch  des  Empfangers)  ist  durch  die  durchschnittliche  Zahl  der  Nachrich- 
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teneinhelten  bestlmmt.  Man  kann  fur  den  mittleren  Informationsgehalt  die 
Entropie  ENT  definieren,  die  durch  die  folgende  Formel  gegeben  ist 

n 

ENT  -  -  £  Pi-log2(pi)  .  (3.10) 

In  dieser  Formel  bedeutet  p.  die  Wahrscheinlichkeit  fur  die  i-te  Nachricht.  Da 
jede  Nachricht  durch  eine  bestimmte  Anzahl  von  Entscheidungen  zwischen  "ja" 
und  "nein"  charakterisiert  ist,  kann  man  die  Ja-Nein-Entscheidung  als  Nach- 
richteneinheit  festlegen.  Man  spricht  dabei  von  Bits  und  rechnet  in 
Zweier-Logarithmen. 

Fur  die  Bildverarbeitung  steht  nach  der  Digitalisierung  jedem  Bildpunkt  des 
Bildes  eine  Menge  {0,1,2, .. .255}  von  insgesamt  256  Graustufen  zur  Verfugung, 
d.h.  ein  Bild  hat  256  Nachrichten.  Es  sei  angenommen,  daB  es  moglich  ist,  fur 
den  Grauwert  g  eine  zugehorige  Wahrscheinlichkeit  p^  anzugeben.  Der  Grauwert  g 
und  die  zugehorige  Wahrscheinlichkeit  p^  bilden  ein  Ensemble.  Der  mittlere 
Informationsgehalt  ist  dann  durch  die  Entropie  gegeben 

255 

ENT  =  -  £  PQ-log2(p  )  .  (3.11) 

g=0  y  y 

Fur  ein  homogenes  Bild  ist  die  Entropie  ENT  *  0,  weil  im  ganzen  Bild  nur  ein 
Grauwert  auftritt. 

(1  g  =  ein  bestimmter  Wert  , 

0  sonst. 

Im  Gegensatz  dazu  erreicht  ein  Bild,  in  dem  alle  Grauwerte  mit  derselben  rela- 
tiven  Wahrscheinlichkeit  pg  =  1/256  auftreten,  die  maximale  Entropie,  namlich 
ENT  ■  8.  Fur  die  meisten  Situationen  konzentriert  sich  das  Histogramm  vom  de- 
fokalen  Bild  auf  einige  Grauwerte  in  der  Nahe  vom  Mittelwert  (Bild  3.3a). 
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Slid  3,3:  Histogramm  eines  defokalen  Bildes. 


OCMMJOOOU 


&  J  # I # I  ■ 
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«*V  ■  *  z  mzmz.mz  #  z m 


Deshalb  hat  ein  defokales  Slid  einen  niedrigen  mittleren  Informationsgehalt, 
namlich  eine  kleine  Entropie.  Ira  Gegensatz  dazu  besitzt  ein  fokales  Bi Id  eine 
groBe  Entropie. 


Bild  3.4:  Histogramm  eines  fokalen  Slides. 

Wie  Bild  3.4a  zeigt*  verteilt  sich  das  Histogramm  iiber  breite  Intervals  in 
der  Grauwertmenge.  In  der  besten  Fokussierungsposition  des  optischen  Systems 
erreicht  die  Entropie  das  Maximum. 
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SMD  ist  eine  Abkiirzung  fur  "Sum  Modulus  Difference",  die  ein  Mali  fur  den 
absoluten  Gradienten  des  Bildes  darstellt.  In  einem  zweidimensionalen 
Koordinatensystem  ist  der  Gradient  eine  stetige  Funktion  zweier  Variablen 


(3.12) 


Der  Betrag  des  Gradienten  ist 


|vg(x,y) | 


und  die  Richtung  des  Gradienten  berechnet  sich  aus 


(3.13) 


’  fia' 

8(vg(x,y))  »  artan  -|j-  .  (3.14) 

.  ^ . 

Durch  den  Gradientenoperator  werden  kleine  Strukturen  im  Bild  hervorgehoben. 
Bild  3.5  zeigt,  daB  beispielsweise  der  Gradientenoperator  fur  die  Kantendetek- 
tion  geeignet  ist.  Der  Gradient  hat  an  einer  Kante  ein  Maximum.  Im  homogenen 
Bereich  ist  der  Gradient  Null. 


Bild  3.5:  Eindimensionale  Grauwertkante  und  ihr  Gradient. 
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I»  Diskreten  kann  der  gradient  nur  approximiert  warden.  Ole  Herstellung  elnes 
Gradlenten  erfordert  In  jedem  Bildpunkt  die  Otfferentilerung  in  zwei  orthogo¬ 
nal  e  Richtungen  der  Ortskoordlnaten.  Weil  der  Grauwert  diskret  1st,  mflssen  die 
Differentialquotienten  durch  endliche  Olfferenzen  ersetzt  werden 


Sa^iXl  .  S 1M1  .  g(x,y)  -  g(x-l.y)  , 

oafcii  ■  g(yj  -  nu.y)  -  9(*.y-n  • 


(3.15) 


3s(x»y)/3x  und  3g(x,y)/ay  sprechen  auf  horizontal  und  vertikal  verlaufende 
Grauwertkanten  entsprechend  an. 


Die  Fokussierungsfunktion  SMO  hat  drel  Formen.  Die  erste  Form 


SMD1 


R-l  L-l 
£  £ 
y=0  X=0 


M3bJ£i 

ax 


R-l  L-l 

£  £  |g(x,y)  -  g(x-l,y)| 

y=0  x=0 


(3.16) 


extrahiert  den  Kantengradienten  entlang  der  x-Richtung.  Gleichfalls  extrahiert 
die  zweite  Form 


L-l  R-l 
SHD2  -  £  £ 

x»0  y*0 


aq(x.y) 

3y 


L-l  R-l 

£  £  lg(x,y)  -  g(xty-l)| 

x-0  y« 0 


(3.17) 


den  Kantengradienten  entlang  der  y-Richtung.  Die  Fokussierungsfunktionen  SKD1 
und  SHD2  haben  einen  Nachteil,  Fur  einige  Bilder  gibt  es  Kanten  nur  entlang 
der  x-Richtung  oder  y-Richtung  (Bild  3.6).  In  dieser  Situation  sind  die 
Gradlenten  entlang  der  y-Richtung  oder  der  x-Richtung  gleich  0. 


- ■—  x 

b)  Gradient  entlang  y-Riehtung 


Bild  3.6:  Zwei  spezielle  Kantenrichtungen. 
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Zur  Vermeidung  dieses  Problems  kann  der  Betrag  des  Gradienten  als 
Fokusslerungsfunktion  benutzt  werden 

L-l  R-l  | - 5 - - - y 

I  (g(x,y)-g(x-l,y)r  +  (g(x,y)-g(x,y-l)r 

x=0  y=0  1 

Ideale  Ableitungsoperatoren  ergeben  sich  im  zweidimensionalen 
Koordinatensystem  aus  folgenden  Operatoridentitaten  [16]: 


g(x,y)  ° — • 
fy  9(x,y)  ° — • 


ju*G(u,v) 

jv-G(u,v) 


Im  Ortsfrequenzbereich  bedeutet  die  Differentiation  eine  Multipliktion  des 
Frequenzspektrums  mit  der  Ortsfrequenz,  d.  h.  es  erfolgt  eine  Anhebung  der 
hohen  Frequenzspektren.  Es  wird  deutlich,  daB  fur  ein  defokales  Bild  die  Lei  - 
stungsspektren  im  hohen  Freuqenzbereich  wegen  der  Defokussierung  gefiltert 
sind,  deswegen  sind  die  Grauwertkanten  nicht  mehr  so  deutlich  ausgepragt  wie 
die  im  fokalen  Bild. 

3.5  Die  lei stungsspektren  des  Bildes  als  Fokussierunqsfunktion 

Die  Lei stungsspektren  im  hohen  Ortsfrequenzbereich  vom  defokalen  Bild  werden 
unterdrQckt.  Man  kann  deshalb  die  Lei stungsspektren  direkt  benutzen,  urn  die 
Fokusslerungsfunktion  zu  berechnen.  Dazu  muB  eine  zweidimensionale  diskrete 
Fouriertransformation  (DFT)  durchgefuhrt  werden.  Man  erhalt  so  die  diskrete 
Four i ertransformi erte 

L-l  R-l 

Gtit.v)  -  g(x,y)-exp[-2ji- j- +  ^l]  •  (3.20) 

Das  Leistungsspektrum  in  der  Ortsfrequenz  (u,v)  ist 


G-j  (u» v)  =  |G(u,v)  r 


(3.21) 
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Die  Fokussierungsfunkt 1 on  kann  durch  die  Summation  der  Leistungsspektren  1m 
hohen  Frequenzbereieh  erzielt  werden,  Es  1st 

IS  -  2  n,M  .  (3*22) 

U,V£*  1 

f  1st  die  Flache  des  hohen  Frequenzbereiches.  In  der  vorllegenden  Arbeit 
besteht  sle  aus  alien  Qrtsfrequenzen  auBerhalb  des  Ursprungs  (u,v)  -  (0,0). 


Die  zweidlmensionale  diskrete  Fourlertransformatlon  1st  eln  zeitraubendes  Ver- 
fahren.  Wenn  man  eine  zweidlmensionale  DFT  eines  NxN  Bildes  direkt  nach  (3.20) 
berechnet,  erfordert  jeder  Bildpunkt  des  transform! erten  Bildes,  das  ja  durch 
die  Multiplikation  der  entsprechenden  Basisfunktion  exp(-2ir*j*  (x-u/N+y-v/N)} 

mit  alien  Bildpunkten  des  Bildes  entsteht,  N2  komplexe  Hultipllkationen  und 
UZ-l  komplexe  Additionen,  Die  Durchfuhrung  der  gesamten  DFT  erfordert  daher 

insgesamt  N4  komplexe  Hultipllkationen  und  N2‘(N2-1)  komplexe  Additionen,  Hit 
der  schnellen  Fourlertransformatlon  (FFT)  kann  die  Rechenzeit  enorm  reduziert 
werden.  Dazu  wird  die  zweidimensionale  DFT  in  zwei  Schritten  berechneti  es  er- 
folgt  namlich  die  Zerlegung  in  eine  Aufeinanderfolge  von  eindimensionalen  DFT. 
Wegen  der  Separierbarkeit  der  Basisfunktion  kann  die  Gleichung  (3.20}  ent- 
sprechend  umgeformt  werden 


G(u»v) 


,  N-l 

r  1 

w  x=0 


'  N-l 

r  S  g{x,y}»exp{-2**j«y*v/N) 
"  y=0 


■exp(-2*-j*x*u/N) 


Die  innere  Summe  stellt  eine  eindimensionale  DFT  der  N  Spalten  dar,  die  auGere 
die  anschlieBende  Transformation  der  N  Zeilen.  Die  2D-DFT  laBt  sich  damit  als 
Aufeinanderfolge  zweier  1D-DFT  ausfuhren,  N  Zeilentransformationen  folgen  N 
Spaltentransformationen  auf  dem  NxN  Bild: 


1  H'1 

Spaltentransformation  G(x,v)  *  k*  5  g(x»y}*exp(- 

y=0 


i  H'1 

Zeilentransformation  G(ufv)  =  r*  S  G(x,v}*exp(- 

x=0 


2?r*j*x-u% 
R  } 
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Fur  jede  der  Teiltransformationen  kann  der  1D-FFT  Algorithms  eingesetzt  wer 
den.  Da  zwei  Transformat ionen  hintereinander  ausgefiihrt  werden,  hat  sich  pro 
Bildpunkt  gerechnet,  der  Aufwand  gegenuber  der  ID-DFT  nur  verdoppelt. 


Fiir  die  qualitative  Beurteilung  der  in  einem  Bild  vorhandenen  Ortsfrequenzen 
wird  fur  das  Leistungsspektrum  |G(u,v)|2  haufig  eine  dreidimensionale  Darstel 
lung  angestrebt.  Sollen  in  der  dreidimensionalen  Darstellung  Spektral komponen 
ten  mit  kleinem  Betrag  starker  betont  werden  als  solche  mit  groBem  Betrag,  so 
kann  die  Funktion  G'(u,v)  einer  dreidimensionalen  Darstellung  von  |G(u,v)|2 
berechnet  werden  gemaB 

G'(u,v)  =  c-log(I+|G(u,v)|2)  ,  (3.23) 

wobei  c  ein  Normierungsfaktor  ist.  Rechts  in  Bild  3.7  ist  ein  fokales  Bild 
gezeigt  und  links  die  dreidimensionale  Darstellung  des  Leistungsspektrums. 


a)  b) 

Bild  3.7:  Leistungsspektrum  vom  fokalen  Bild. 

In  diesem  Fall  sind  die  Leistungsspektren  im  hohen  Frequenzbereich  nicht  un- 
terdriickt.  Im  Gegensatz  dazu  zeigt  das  Bild  3.8  ein  defokales  Bild  und  die 
entsprechend  dreidimensionale  Darstellung  des  Spektrums.  In  dieser  Situation 
sind  die  Leistungsspektren  im  hohen  Frequenzbereich  verschwunden  bzw.  stark 
unterdruckt. 


Bestmdgiiche  Kopie 


CO 


Bild  3,8:  Dreidimensionale  Barstellung  des  Leistungsspektrums  vom  defokalen 
Bild, 

3.6  Die  Sionalleistung  der  Grauwerte  als  Fokussierungsfunktion 
Die  Signallei stung  des  Slides  ist  durch  folgende  Gleichung  definlert; 

L-l  R-l  5 

SL  =  £  £  g(x,yr  .  (3.24) 

x=0  y=0 

SL  ist  proportional  zur  Energie  itn  Bild.  Fur  das  fokale  Bild  sind  die  Energien 
im  hohen  Frequenzbereich  nicht  gefiltert,  die  SL  wird  ihr  Maximum  erreichen. 

Henn  die  OOF  annahernd  als  GauBverteilung  dargestellt  1st,  kann  man  zeigen, 
da8  die  SL  das  Maximum  im  besten  Fokussierungszustand  des  Bildes  erreicht, 
Normalerweise  erfiillen  die  Bilder  das  Parseval -Theorem  fur  die  zweidimensiona- 
1e  DFT 


L-l  R-l  9  L-l  R-l  * 

£  £  g(x,yr  «  L-R*  £  £  G(u,v).G  (u,v)  . 

x=0  y=0  x=0  y=0 

Im  Ortsfrequenzbereich  ergibt  sich 


2  2  2 

6(u,v)  =  F(u,v)*H(u,v)  =  F(u,v)*expJ- 


(3.25) 


(3.36) 
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F ( u , v )  ist  die  Fouriertransformierte  vom  Eingangsbild  Oder  vom  fokalen  Bild. 
Fur  eine  bestimmte  Szene  ist  F(u,v)  unverandert,  wahrend  sich  der  Fokussie- 
rungszustand  vom  optischen  System  verSndert.  Weiter  ist 

G(u,v)-G*(u,v)  ■=  F(u,v)-F*(u,v)-exp(-(u2+v2)-a2)  , 

-  jF(u,v) |2-exp(-(u2+v2)*o2)  .  (3.27) 

Setzt  man  (3.27)  in  (3.25)  ein,  so  ergibt  sich 

L ’I  R-l  o  979 

SL  =  L-R.  E  E  |F(u,v)|z.exp(-(uz+vz)-az)  . 
u=0  v=0 

Weil  F(u,v)  fur  eine  unveranderte  Szene  bestimmt  und  j F(u, v) | 2  >  0  ist,  ist  SL 
nur  von  dem  Ausdehnungsparameter  a  abhangig. 

Wenn  SL  ein  Extremum  erreicht,  muG 

disu.o 

da 

gel  ten,  wobei 

s  -  2a-R-L-  E  E  |F(u,v) |2- (u2+v2)-exp(-(u2+v2)*a2)  (3.28) 
u=0  v=0 


ist. 

Wenn  das  Bild  homogen  ist,  also  alle  Grauwerte  des  Bildes  identisch  sind, 

haben  alle  Leistungsspektren  bis  auf  das  Leistungsspektrum  |F(0,0)J2  den  Wert 
0.  Deshalb  ist 


L“1  R-l  999  999 

2R-L-  E  E  |F(u, v) |  • (uz+vz) *exp(-(uZ+vZ) -a2) 
u=0  v^O 

immer  Null,  d.h.,  die  Fokussierungsfunktion  SL  ist  unabhangig  von  dem  Ausdeh¬ 
nungsparameter  a.  In  diesem  Fall  hat  SL  die  Fahigkeit  zur  Fokussierung  verlo- 
ren.  Im  Gegensatz  dazu  besitzt  ein  inhomogenes  Bild  Leistungsspektren  im  hohen 
Frequenzbereich.  In  diesem  Fall  ist 
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2R*L*V  V  |F{u,v}|2*(u2-t-vZ)*expHu2+v2)-<x2)  >  0. 
u-0  v*0 

Das  bedeutet,  nur  wenn  tj  gleich  0  1st*  erreicht  SL  das  Extremum.  Ein  von  Null 
identisches  a  bedeutet*  daB  das  optische  System  im  besten  Fokussierungszustand 
1st.  AuBerdem  ist 


L-l 


u=0 


R-l 

£ 

v=0 


|F(u,v) | 2* (u2+v2) • Cl-2{uZ+v2) *o2] * 
*exp[-(u2+v2)-02] 


Im  Fall  a  *  0  ergibt  sich 

j2 (pi  i  t-1  R*1  9  9  9 

d  W  =  -  2R«L»  £  £  lF(u,v}|  *(u  +v*)  <  0  . 

d(T  u=0  v=0 

Das  bedeutet,  daB  SL  einen  maximalen  Wert  im  besten  Fokussierungszustand  des 
optischen  Systems  erreicht. 

In  der  Praxis  ist  die  SL  als  Fokussierungsfuntion  nicht  gunstig,  weil  die 
Kurve  von  SL  zu  flach  ist  {Bild  3.9). 


Bild  3.9:  SL  als  Fokussierungsfunktion. 
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Um  diesen  Nachteil  zu  vermeiden,  wird  eine  veranderte  SL  als  Fokussierungs 
funktion  benutzt.  Es  ist  dies 


L-l  R-l  - 

SL'  »=  £  £  g'(x,y)Z  , 

x=0  y=0 


wobei  g'(x,y)  durch  folgende  Gleichung  definiert  ist: 


g'(x,y) 


g(x,y)  wenn  g(x,y)  <  g  , 
0  sonst 


(3.29) 


(3.30) 


* 

g  ist  eine  Konstante,  die  durch  das  Experiment  bestimmt  ist.  Bild  3.10  zeigt 
den  Verlauf  von  SL' . 


Bild  3.10:  SL'  als  Fokussierungsfunktion. 

Beim  Vergleich  zwischen  Bild  3.9  und  Bild  3.10  bemerkt  man,  daB  die  besten 
Fokussierungspositionen  beider  Kurven  keinen  Unterschied  haben,  aber  die  SL' 
erreicht  nicht  den  maximalen  Wert  sondern  einen  minimalen  Wert. 

3.7  "Thresholded  Video  Signal  Pixel  Count"  als  Fokussierungsfunktion 

Die  Fokussierungsfunktion  "Thresh..."  (TV)  ist  die  Zahl  der  Bildpunkte  im 
Bild,  deren  Grauwerte  uber  oder  unter  einem  bestimmten  Schwellenwert  liegen. 
TV  berechnet  sich  gemaB: 

L-l  R-l 

TV  =  £  £  S[g(x,y),/z,c)  , 

x=0  y=0 


(3.31) 
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wobei  S[g(x,y)»M»c]  durch  die  Gleichung 


S[g(x*y)*M*c] 


I 

o 


wenn  Jg(x,y)  -  fi\  >  c 
sonst 


(3.32) 


definiert  1st.  jt  1st  eine  Variabe*  die  vom  Bild  abhangig  ist.  In  der  vorlie- 
genden  Arbeit  wird  fi  als  der  Mittelwert  des  Bildes  gewShlt,  c  ist  eine  Kon- 
stante,  die  normalerweise  durch  das  Experiment  bestimmt  ist.  Ein  zu  groRes 
oder  zu  kleines  c  ergibt  eine  schlechte  Fokussierungsfunktion.  Das  Fokussie- 
rungsprinzip  der  TV  kann  durch  die  Defokussierungswirkung  auf  eine  eindimen- 
sionale  Grauwertkante  erklart  werden. 


Bild  3.11:  Eindimensionale  Kante. 

Im  Fall  der  richtigen  Fokussierung  ergibt  sich  eine  ideale  Grauwertkante  (Bild 
3.11a).  Der  Mittelwert  der  Kante  ist  (a+b)/2.  Wenn  die  Konstante  c  so  gewahlt 
wirds  daR  c  <  (a-b)/2  erfullt  ist,  dann  erreicht  die  Fokussierungsfunktion  TV 
das  Maximum  TV  =  L,  Aber  wenn  die  Kante  defokussiert  ist,  wie  in  Bild  3.11b 
gezeigt,  sind  die  Grauwerte  verschliffen.  Die  Grauwerte  von  vielen  Bildpunkten 
befinden  sich  innerhalb  des  Intervalls  Ui-c,fi+c].  Die  Defokussierungsfunktion 
ist  in  dieser  Situation  kleiner  als  L.  Je  schlechter  der  Fokussierungszustand 
ist,  desto  schiefer  wird  die  Kante,  und  es  befinden  sich  immer  mehr  Bildpunkte 
im  Interval!  [/i-c,ji+c]. 


Wenn  die  Haufigkeit  des  Auftretens  der  Grauwerte  p(g)  eine  Funktion  von  g  ist, 
ist  der  Wert  TV  proportional  zur  Flache  der  gestrichelten  Gebiete  in  Bild  3.12 
und  Bild  3.13,  also 


TV  =  L-R. 


P(9)*dg 


Bild  3.12:  Histogramm  des  fokalen  Bildes. 
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Bild  3.13;  Histogramm  des  defokalen  Bildes. 

Fur  ein  defokales  Bild  konzentriert  sich  das  Histogramm  in  der  Nahe  vom 
Mittelwert  der  Grauwerte.  Die  Flache  der  gestrichelten  Gebiete  (Bild  3.13)  ist 
dann  kleiner  als  die  bei  einem  fokalen  Bild. 


Es  ist  klar,  daB  die  Auswahl  der  Konstante  c  sehr  wichtig  ftir  die  Fokussie¬ 
rungsfunktion  TV  ist.  Nenn  c  zu  groB  ist,  wird  TV  =  0.  Im  Gegensatz  eines  zu 
kleinen  c  verlauft  die  Kurve  der  Fokussierungsfunktion  zu  flach. 

Die  Konstante  c  kann  aus  deni  Histogramm  des  fokalen  Bildes  ermittelt  werden. 
Normal erweise  wird  sich  beim  fokalen  Bild  ein  bimodales  Histogramm  ergeben. 
Der  Mittelwert  befindet  sich  zwischen  den  beiden  Maxima.  Die  Konstante  c  mu8 
dann  kleiner  als  l^'9max2J  seift  3*12^* 

3.8  Der  Laolace-Ooerator  der  Grauwerte  als  Fokussierungsfunktion 

Wie  gezeigt  wurde,  liegt  der  Unterschied  zwischen  dem  fokalen  und  dem  defoka 
len  Bild  bei  hohen  Frequenzen.  Das  zweite  Moment  der  Fourierspektren  ist  ein 
MaS  fur  die  hohen  Frequenzkomponenten  des  Bildes 


L-l  R-l  9  ?  ? 

L0  -  k*  S  £  |(ttW)-G(u,v)r 
u=0  v=0 


{3.34} 


In  der  Fokussierungsfunktion  L0  sind  die  hohen  Frequenzkomponenten  stark 
hervorgehoben.  Wenn  die  Konstante  k  als 


k  -  (4-it2)Z-L  R 


gewahlt  wird,  ergibt  sich 


L-l  R-l 
L0  =  L*R*  S  £ 
u=0  v=0 

L-l  R-l 
=  L-R*  £  E 
u=0  v=0 


Im  Zweidimensionalen  gilt 


|(4A2*u2+4ir2-v2)*G(u,v)j2 

j(-47t2*u2-4it2*v2)*G{u,v)(2 
folgende  Operatoridentitat: 


(3.35) 
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Wegen  des  Parseval -Theorems  bekommt  man  folglich 


L-l  R-lr  , 
LO  =  E  E  7 
x=0  y=0*“ 


■g(x,y)J 


Im  Zweidimensionalen  ist  der  Lap! ace-Operator 


v  g(x,y)  =  ZJWUU.  +  . 

ax £  a/ 

Die  Approximation  der  zweiten  Ableitung  durch  Differenzen  ergibt 


-  g(x+l,y)  -  2g{x,y)  +  g(x-l,y)  , 


2°  =  9(x,y+l)  -  2g(x,y)  +  g(x,y-l) 


Setzt  man  7^g(x,y)  in  (3.37)  ein,  so  folgt 


L-l  R-lr  i, 

LO  =  E  E  g(x+l,y)  +  g(x-l,y)  +  g{x,y+l)  +  (x,y-l)  -  4g(x,y)  1 
x=0  y=0[ 


Im  Bild  entfernt  der  Lapl ace-Operator  nicht  nur  die  konstanten  Grauwertbe- 
reiche,  sondern  auch  jede  konstante  Grauwertsteigung.  Es  ist  zu  beachten,  dali 
der  Lapl  ace-Operator,  angewendet  auf  eine  beliebig  geneigte  Ebene,  den  Wert  0 
ergibt,  obwohl  die  Gradienten  dieser  Flache  nicht  den  Wert  0  haben. 

3.9  Das  Differential  der  Varianz  als  Fokussierunasfunktion 


Die  Varianz  der  Grauwerte  VAR  als  Funktion  der  Fokussierungsposition  p'  hat 
ein  sehr  gutes  unimodulares  Verhalten  im  wirksamen  Arbeitsbereich  der  Kamera. 
Als  unimodulare  Funktion  erreicht  VAR(p')  das  Extremum  in  der  Position,  wo 


ist  (Bild  3.14). 
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Als  die  ideale  unimodulare  Funktion  nimmt  VAR  auf  der  linken  Seite  der  besten 
Fokussierungsposition  monoton  zu  und  auf  der  rechten  Seite  entsprechend  ab. 
Deshatb  schneidet  das  Differential  der  Varianz  in  der  besten  Fokussierungspo¬ 
sition  die  p'-Achse.  Um  die  beste  Fokussierungsposition  zu  finden,  braucht  man 
also  nur  den  Nulldurchgangspunkt  in  der  p'-Achse  zu  bestimmen.  Als  Fokussie- 
rungsfunktion  lautet  das  Differential  der  Varianz 

DVAR(p#)  =  dVffiP--^  «  VAR(p')  -  VAR(pM)  .  (3.40) 

Aber  fast  alle  Bilder  sind  verrauscht,  besonders  im  unwirksamen  Arbeitsbereich 
der  Kamera.  Wie  Bild  3,14  zeigt,  geht  DVAR(p')  mehrmals  durch  die  Abszisse. 
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Bild  3.15:  Auswirkung  des  Filters. 

Um  dieses  Problem  zu  losen,  wird  ein  TiefpaBfilter  benutzt.  Das  einfachste 
TiefpaBfilter  hat  die  Form 

DVAR'(p')  =  a*DVAR(p' )  +  b-DVAR(p'-l)  ,  (3.41) 

wobei  a,  b  die  Konstanten  sind,  die  die  Forderung  a  +  b  =  1  erfiillen.  Die  Wahl 
von  a,  b  ist  sehr  wichtig  fur  das  Filterergebnis.  Wenn  a  zu  klein  ist,  ist  das 
Rauschen  nicht  gut  herausgefiltert.  Bei  einem  zu  groBen  a  wird  die  Funktion 
DVAR'(p')  mit  groBer  Verzogerung  auftreten  (Bild  3.15).  Diese  Verzogerung  kann 
allerdings  durch  Experimente  bestimmt  und  im  Rechenprogramm  kompensiert  wer- 
den. 
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4.  Beurteilung  der  verschiedenen  Fokussierungsfunktionen  durch  Experimente 

Zur  Beurteilung  der  Vor-  und  Nachteile  der  verschiedenen  Fokussierungsfunktio¬ 
nen  werden  Experimente  durchgefuhrt.  Die  Ergebnisse  der  Experimente  sind  durch 
die  Kurven  der  FF  dargestellt,  In  den  Experimenten  wird  die  Position  des  zu 
fokussierenden  Objektes  nicht  verandert,  nur  die  Kamera  bewegt  sich.  Ein  com- 
putergesteuerter  Schrittmotor  wird  benutzt  zur  Kontrolle  der  Bewegung  der  Ka¬ 
mera.  Das  Dbjekt  befindet  sich' 225  mm  weit  von  der  Anfangsposition  der  Kamera. 
Die  Kamera  tastet  die  Szene  von  0  mm  bis  zu  200  mm  ab.  Jeder  Abtastschritt  1st 
1  mm,  d.h.  jede  Kurve  der  FF  hat  201  Abtastpunkte,  Um  so  viele  Oaten  zu  behan- 
deln,  ist  ein  automatisches  MeBprogramm  zu  entwickeln.  Nach  der  Abtastung  der 
Szene  wird  die  Fokussierungsfunktion  berechnet. 


Anfangsposition  der  Kamera  Objektebene 

-  225mm  - 


Schrittmotor 


P3 


Kamera 


y/ ////////////;// * 

Spindelschlittensystem 


Bild  4.1:  Skizze  der  experi mental en  Vorrichtung. 


Um  die  grafische  Darstellung  der  MeBergebnisse  zu  erleichtern,  werden  alle 
Fokussierungsfunktionen  durch  den  jeweiligen  Maximal wert  normiert.  Desha! b  ist 
das  Maximum  der  Fokussierungsfunktionen  immer  1.  Es  ist  angenommen,  daB  die  zu 
fokussierenden  Objekte  eine  ebene  Oberflache  besitzen  Oder  deren  Schnittdicke 
kleiner  als  die  Scharfentiefe  der  Kamera  ist. 


Um  den  EinfluB  des  Rauschens  zu  unterdrucken,  sollten  giinstigerweise  mehr 
Bildpunkte  benutzt  werden,  aber  das  kostet  Rechenzeit.  Um  die  Rechenzeit  der 
FF  zu  verkurzen,  werden  nicht  alle  Bildpunkte  im  Bild  benutzt.  Fur  das  Lei- 
stungsspektrum  werden  nur  32x32  Bildpunkte  verwendet,  die  innerhalb  eines  Fen- 
sters  (62,62)  -  (372,372)  im  Abstand  von  10  Bildpunkten  rasterformig  verteilt 
sind.  Fur  alle  anderen  Fokussierungsfunktionen  wird  das  Fenster 
(0,0)  -  (511,484)  benutzt.  Dabei  wird  jede  neunte  Zeile  verwendet.  Insgesamt 
werden  also  512x54  =  27648  Bildpunkte  benutzt. 
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Wahrend  der  Experimente  sind  alle  Parameter  der  Kamera,  z.B.  die  Blendenzahl, 
die  Brennweite  usw.,  festgelegt.  Fur  alle  Fokussierungsfunktionen  werden 
folgende  Experimente  durchgefiihrt. 

4.1  Der  EinfluB  der  Beleuchtuna 

Ein  Objekt  wird  sichtbar  durch  Reflexion,  Brechung  Oder  Streuung  von  Licht. 
Objekteigenschaften  spielen  dabei  eine  Rolle  wie  die  Natur  der  Lichtquelle 
(Beleuchtungsverhaltnisse).  Wahrend  in  "natiirl ichen"  Szenen  die  Lichtverhalt- 
nisse  meistens  vorgegeben  sind,  hat  man  bei  der  Aufnahme  wissenschaftlicher 
Objekte  viele  Mogl ichkeiten,  die  Beleuchtungsverhaltnisse  optimal  zu  gestal- 
ten.  Die  Aufnahmebedingungen  stehen  in  enger  Beziehung  zu  der  geplanten  Aus- 
wertung  der  Bilder. 

Die  Frage  der  Beleuchtungsverhaltnisse  besteht  im  einfachsten  Fall  aus  zwei 
Teilaspekten  (Bild  4.2).  Das  von  einer  Oder  mehreren  Lichtquellen  ausgestrahl- 
te  Licht  trifft  mit  einer  gewissen  Beleuchtungsstarke  auf  dem  Objekt  auf.  Dort 
wird  es  absorbiert,  gebrochen  und  reflektiert. 


Bild  4.2;  Beleuchtungsverhaltnisse  bei  Objekten. 

Der  Bruchteil  der  in  den  Raumwinkel  gestreuten  Strahlen,  die  die  Kamera  tref- 
fen,  bestimmt  die  Grauwerte,  mit  der  das  Objekt  gesehen  wird.  Damit  bestimmen 
sowohl  die  Beleuchtungsstarke  als  auch  das  Reflexionsverhalten  die  Grauwerte 
des  Objektes. 

In  natiirl  ichen  Szenen  hat  man  es  in  der  Regel  mit  undurchsichtigen  Oberflachen 
zu  tun.  In  diesem  Fall  muB  nur  das  Reflexionsverhalten  von  Oberflachen  unter- 
sucht  werden.  Betrachtet  man  die  von  einer  Lichtquelle  ausgesandten  Strahlen, 
so  gibt  es  zwei  Falle  der  Betrachtungsweise.  Erstens  den  Fall,  daB  in  Richtung 
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der  Lichtquelle  beobachtet  auf  diese  Strahlen  Bezug  genommen  wird.  Zweitens, 
daB  diese  Strahlen  in  bezug  auf  eine  FI  ache  betrachtet  werden,  auf  die  das 
ausgestrahlte  Licht  auftrifft, 

Unter  der  Bedingung  der  undurchsichtigen  Oberflache  der  Gbjekte  warden  fol- 
gende  Untersuchungen  durchgefiihrt: 

a)  Untersuchung  des  Einflusses  auf  die  FF  durch  Veranderung  der 
Beleuchtungsstarke. 

Fur  eine  gute  FF  ist  der  EinfluB  der  Beleuchtungsstarke  unempfindl ich;  aber 
fast  alle  von  der  Kamera  aufgenommenen  Bilder  sind  durch  das  Rauschen  ver- 
schmiert.  Es  ist  klar,  wenn  die  Beleuchtungsstarke  groB  1st,  ist  das 
Signal -zu-Rauschverhaltnis  (SNR)  auch  groB,  Oeshalb  beeinfluBt  das  Rauschen 
die  FF  nicht  so  stark. 

In  den  Experitnenten  wird  die  FF  bei  verschiedenen  Beleuchtungsstarken  ge- 
messen.  Eine  zusatzliche  Lichtquelle  wird  benutzt,  urn  die  Beleuchtungsstar¬ 
ke  zu  verandern.  Die  Beleuchtungsstarke  wird  durch  den  Mittelwert  des  Bil- 
des  reprasentiert. 


Die  Fokussierungsfunktionen  werden  in  drei  Gruppen  eingeteilt.  Die  erste 
Gruppe  besteht  aus  den  Fokussierungsfunktionen  VAR,  ENT,  LS  und  TV,  Die  FF 
von  dieser  Gruppe  ist  durch  die  globale  Bildverarbeitung  zu  bekommen.  Die 
zweite  Gruppe  ist  die  SMD  und  die  LO.  Die  Berechnung  von  SMD  und  LO  braucht 
nur  die  arithmetischen  Operationen  mit  den  Nachbargrauwerten  des  jeweiligen 
Bildpunktes.  Die  dritte  Gruppe  mit  der  SL#  ist  die  sogenannte  punktbezogene 
FF, 

Aufgrund  der  Ergebnisse  der  Experimente  ist  deutlich  erkennbar,  daB  die 
Kurven  der  ersten  Gruppe  wenig  durch  die  Beleuchtungsstarke  beeinfluBt  wer¬ 
den.  Bild  4,3a  zeigt  die  Varianz  der  Grauwerte  bei  verschiedenen  Beleuch- 
tungstarken,  weil  durch  die  globale  Verarbeitung  das  Rauschen  des  Bildes 
unterdruckt  wird.  Aber  die  FF  der  zweiten  und  dritten  Gruppe  werden  dagegen 
durch  die  Beleuchtungsstarke  intensiv  beeinfluBt.  Im  Bild  4.3b  hat  die  Kur- 
ve  bei  einer  bestimmten  Beleuchtungsstarke  ihre  unimodulare  Form  verloren. 
Die  Grunde  hierfur  sind,  daB  durch  die  lokale  Differentiation  der  Grauwerte 
nicht  nur  die  Grauwertekante,  sondern  auch  das  Rauschen  hervorgehoben  wer¬ 
den. 
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Bild  4.3a:  Varianz  bei  verschiedenen  Beleuchtungsstarken. 


Bild  4.3b:  SMD  bei  verschiedenen  Beleuchtungsstarken. 

b)  Untersuchung  des  Einflusses  auf  die  FF  durch  die  Veranderung  der 
Beleuchtungsrichtung. 

Der  Einflufi  der  Beleuchtungsrichtung  wird  durch  das  Reflexionsverhalten  der 
Oberflache  des  Objektes  bestimmt.  Wenn  die  Szene  eine  ebene  Oberflache  be- 
sitzt,  stehen  die  Normalen  aller  Flachenelemente  unter  einer  bestimmten 
Richtung  zu  dem  einfallenden  Strahl .  Ein  Oberflachenelement  erhalt  nur 
Licht  von  der  Lichtquelle.  In  dieser  Situation  spiel t  die  Beleuchtungsrich¬ 
tung  nur  eine  geringe  Rolle  (Bild  4.4).  Aber  wenn  die  Szene  aus  dreidimen- 
sionalen  Gebilden  besteht,  stehen  die  Normalen  der  Flachenelemente  in  ver¬ 
schiedenen  Richtungen  zu  dem  einfallenden  Strahl.  So  erhalt  ein  Ober¬ 
flachenelement  nicht  nur  Licht  von  den  Lichtquellen  direkt,  sondern  auch 
indirekt  von  alien  anderen  Oberflachenelementen.  Deshalb  beeinflussen  die 
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Lage  und  das  Reflexionsverhalten  aller  Oberflachenelemente  in  einer  Szene 
den  Grauwert  eines  Oberflachenelementes,  In  diesem  Fall  spielt  die  Beleuch- 
tyngsrichtung  eine  wichtige  Rolle  fur  die  FF.  Wie  Bild  4.5  zeigt,  ist  die 
FF  eine  regellose  Kurve,  wenn  die  Lichtquelle  direkt  von  vorn  auf  die  Szene 
gerichtet  ist. 


Bild  4.4:  SMD  in  verschiedenen  Beleuchtungsrichtungen. 


Bild  4.5:  TV  in  verschiedenen  Beleuchtungsrichtungen. 

Auch  wenn  die  Positionen  der  Objekte  und  Lichtquellen  und  die  Reflexions- 
eigenschaften  bekannt  sind,  ist  es  trotzdem  sehr  schwierig,  die  Grauwerte 
durch  Losung  eines  gekoppelten  Gleichungssystems,  in  dem  die  entsprechende 
Anzahl  Oberflachenelemente  enthalten  ist,  zu  ermitteln.  Oeshalb  ist  es  noch 
unmoglich,  den  EinfluB  der  Beleuchtungsrichtung  auf  der  FF  quantitativ  zu 
analysieren. 
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c)  Untersuchung  des  Einflusses  auf  die  FF  durch  Veranderung  der 
Beleuchtungsfarben. 

Die  Lichtquelle  strahlt  weiBes  Licht  aus.  WeiBes  Licht  ist  im  streng 
physikal ischen  Sinne  ein  aus  alien  Wellenlangen  des  sichtbaren  Spektralbe- 
reiches  energiegleich  gemischtes  Licht.  Die  Wellenlangen  liegen  fur  sicht- 
bares  Licht  zwischen  X  «=  380  nm  und  X  =  780  nm.  Die  Energieverteilung  auf 
die  einzelnen  Frequenzintervalle  bestimmt  die  Farbzusammensetzung  und  den 
Farbeindruck.  Das  menschliche  Auge  spricht  auf  Licht  unterschiedl icher  Wel- 
lenlange  verschieden  stark  an. 

Filter  andern  die  spektrale  Energieverteilung  einer  durchgehenden  Strah- 
lung.  Als  einfachstes  Filter  sind  die  Farbglaser  anzufuhren,  die  aufgrund 
ihrer  selektiven  Absorption  einen  Teil  der  Strahlung  wegfiltern  und  die 
Lichtstarke  laBt  durch  die  Farbglaser  nach.  Fur  die  Photographie  dienen 

Filter  in  erster  Linie  zur  richtigen  Wiedergabe  der  Farbhelligkeiten  in  den 

entsprechenden  Grauwerten.  Bei  starker  Beleuchtung  werden  Filter  verwendet, 
um  die  kontrastschwachende  Strahlung  zu  absorbieren.  Damit  wird  die  Bild- 
qualitat  verbessert. 

In  den  Experimenten  werden  drei  Farbglaser  mit  den  Farben  Indigo,  Griin  und 
Rot  benutzt.  Die  Wellenlangen  von  Indigo,  Grun  und  Rot  sind  430,8  nm, 

527,0  nm  und  686,3  nm.  Werden  die  mit  Indigo  gefarbten  Glaser  benutzt,  ist 
der  enge  Spektralbereich  in  der  Nahe  von  430,8  nm  durchlassig,  die  anderen 
Spektralbereiche  sind  dagegen  undurchlassig.  Bei  den  anderen  Farben  ent- 
sprechend. 

Die  Ergebnisse  zeigen,  daB  -  wenn  die  Beleuchtung  nicht  zu  stark  ist  -  der 

EinfluB  der  Farbglaser  auf  die  FF  nur  schwer  erkennbar  ist  (Bild  4.6). 


-  66  - 


Bild  4,6:  SMD  bei  verschiedenen  Beleuchtungsfarben. 


Bild  4.7:  LO  bei  verschiedenen  Beleuchtungsfarben. 

1st  die  Beleuchtung  stark,  wird  der  Kontrast  im  Bild  abgeschwacht.  Durch 
die  Benutzung  der  Farbglaser  kann  die  Bildqualitat  erhoht  werden,  damit 
wird  die  Kurve  der  FF  deutlich  verbessert  (Bild  4.7). 
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4.2  Per  EinfluB  von  Mustern  des  Obiektes 


Um  den  EinfluB  auf  die  FF  durch  Muster  zu  priifen,  werden  folgende  Muster  vor- 
bereitet  (Bild  4.8). 


e)  Linie  f)  Kreis 

Bild  4.8:  Verschiedene  Muster. 


Alle  sechs  Muster  sind  kiinstlich,  sie  beinhalten  unterschiedl iche  Texturen. 
Die  Ergebnisse  der  Experimente  zeigen,  daB  alle  Fokussierungsfunktionen  auBer 
SMD  und  ENT  ein  gutes  Anpassungsvermogen  an  Muster  haben. 

Die  Fokussierungsfunktion  ENT  ist  kein  zuverlassiges  Fokussierungskriterium. 
Es  liefet  zwar  in  den  meisten  Fallen  Ergebnisse,  die  mit  den  Ergebnissen  der 
anderen  FF  1m  Einklang  stehen,  versagt  jedoch  vollstandig  bei  Bildern,  in  de- 
nen  wenige  Grauwerte  gehauft  auftreten. 
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Bild  4,9;  ENT  von  verschiedenen  Mustern, 

Die  Kurve  1  in  Bild  4.9  ist  die  ENT  des  Musters  Kreis.  In  der  besten  Fokus- 
sierungsposition  liefert  ENT  nicht  das  Maximum,  sondern  das  Minimum.  AuSerdem 
ist  die  Kurve  von  ENT  zu  flach.  In  der  Nahe  der  besten  Fokussierungsposition 
verandert  sich  die  ENT  wenig.  Deshalb  ist  die  Genauigkeit  von  ENT  niedrig. 

Weil  die  ENT  in  bestimmten  Fallen  vollstandig  versagt  und  gegenuber  den  ande- 
ren  FF  keine  Vorteile  aufweist,  soli  sie  bei  den  weiteren  Messungen  nicht  mehr 
verwendet  werden. 

Die  SMD1  als  FF  liefert  keine  Informationen  iiber  den  Fokussierungszustand, 
wenn  die  Szene  aus  einem  Linienmuster  besteht.  SMD1  extrahiert  nur  den 
Kantengradient  entlang  der  x-Richtung.  Wenn  die  SMD3  als  FF  benutzt  wird,  kann 
dieses  Problem  allerdings  vermieden  werden  (Bild  4.10). 


Bild  4.10:  SMD  eines  Linienmusters. 
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4,3  Die  Reaktion  der  Fokussierungsfunktionen  bei  texturfreien  Bildern 

All e  Fokussierungsfunktionen  basieren  auf  der  FI uktuat i on  der  Grauwerte  des 
Bildes.  Das  Bild  von  einem  texturfreien  Objekt,  z.B.  ein  weiBes  Papier,  ist 
homogen,  d.h.  in  diesem  Bild  tritt  nur  ein  bestimmter  Grauwert  auf.  In  dieser 
Situation  sind  alle  Leistungsspektren,  auBer  dem  Leistungsspektrum  vom  Ur- 
sprung,  also  u  =  0  und  v  =  0,  Null.  Deshalb  sind  die  aufgefiihrten  Fokussie¬ 
rungsfunktionen  ungeeignet  zur  Fokussierung  eines  .texturfreien  Objektes.  Wenn 
das  optische  System  ideal  ist,  d.h.  das  Bild  nicht  durch  Rauschen  verschmiert 
ist,  ist  die  Fokussierungsfunktion  eines  texturfreien  Bildes  konstant.  Durch 
die  Fokussierungsfunktion  eines  texturfreien  Bildes  kann  man  deshalb  den  Ein¬ 
fluB  von  Rauschen  direkt  bemerken  und  auch  extrahieren. . 


Bild  4.11:  FF  des  texturfreien  Bildes. 

Bild  4.11  zeigt  LO(p')  und  LS(p')  des  texturfreien  Bildes.  Die  anderen 
Fokussierungsfunktionen  sind  ahnlich  wie  LO(p')  und  nicht  so  stark  durch 
Rauschen  beeinfluBt.  Weil  das  Leistungsspektrum  als  FF  wenige  Bildpunkte 
benutzt,  ist  der  EinfluB  von  Rauschen  deutlich  bemerkbar.  Den  EinfluB  des 
Rauschens  kann  man  auch  durch  die  Fokussierungsfunktionen  LO(p')  und  LS(p') 
beim  Muster  Honig  bemerken  (Bild  4.12). 
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Slid  4,12:  FF  vom  Muster  Honig. 

Im  wirksamen  Bereich  der  Kamera  1st  die  Kurve  von  LS(p#)  gut,  aber  1m 
unwirksamen  Bereich  hat  LS{p'}  groBe  Schwlngungen. 

4.4  Die  Fokussierunosfunktionen  bei  farbioen  Mustern 

Das  Ziel  dieses  Experiments  1st  die  Untersuchung  des  Reflexionsgrads  von  far- 
bigen  Mustern.  Das  Objekt  1st  das  Muster  Quadrat  auf  dem  weiBen  Papier 
(Hintergrund).  Der  Hintergrund  bleibt  unverandert,  die  Farben  des  Musters  sind 
unterschiedlich: 

a)  schwarz, 

b)  blau, 

c)  gelb, 

d)  rot. 

In  dem  Experiment  wird  die  Beleuchtung  nicht  verandert.  Es  1st  bekannt,  daB 
der  Grauwert  g(x,y)  sich  aus  dem  Produkt  der  Beleuchtungsstarke  i(x,y)  und  des 
Reflexionsgrades  vom  Objekt  l(x,y)  ergibt: 

g(x,y)  =  i(x»y)*l{x,y)  . 

Der  Reflexionsgrad  des  Hintergrundes  1st  sehr  groB,  deshalb  ist  der  Hinter¬ 
grund  im  Bild  immer  hell.  Wenn  der  Reflexionsgrad  des  Musters  klein  1st,  also 
das  Bild  des  Musters  dunkel  bleibt,  ist  der  (Contrast  des  Bildes  stark.  Deshalb 
erhalt  man  eine  gute  Kurve  der  FF. 


-  71  - 


Bild  4.13:  VAR  von  farbigen  Mustern. 

In  Bild  4.13  ist  Kurve  1  die  VAR  vom  schwarzen  Muster.  Sie  ist  die  gunstigste 
Kurve  zur  Fokussierung.  Die  schwarze  Farbe  kann  wenig  Licht  reflektieren.  Des- 
wegen  ist  der  Kontrast  des  Bildes  stark.  Wenn  das  Muster  blau  ist,  kann  man 
auch  eine  gute  Kurve  der  VAR  bekommen.  Kurve  1  und  Kurve  2  iiberlappen  sich  im 
wirksamen  Bereich  der  Kamera  fast.  Kurve  3  ist  ziemlich  flach,  mit  Hilfe  die- 
ser  Kurve  kann  die  beste  Fokussierungsposition  schwer  gefunden  werden.  Kurve  3 
ist  die  VAR  des  roten  Musters.  Durch  dieses  Experiment  bemerkt  man,  daB  der 
Reflexionsgrad  von  Rot  groBer  als  der  von  Schwarz  und  Blau  ist.  Ist  das  Muster 
gelb,  verliert  das  Bild  seinen  Kontrast  total.  In  Kurve  4  ist  VAR  im  ganzen 
Fokussierungsbereich  fast  unverandert.  Kurve  4  enthalt  keine  Information  uber 
den  Fokussierungszustand  der  Kamera. 

Die  Ergebnisse  des  Experiments  zeigen,  wenn  eine  farbige  Szene  durch  Digital i - 
sierung  in  ein  monochromatisches  Bild  umgewandelt  wird,  gehen  viele  Informati- 
onen  der  Szene  verloren. 

4.5  Die  Fokussierunqsfunktionen  bei  unscharfen  Konturen 

Manchmal  hat  die  zu  fokussierende  Szene  eine  unscharfe  Kontur,  z.B.  besteht 
die  Szene  aus  Objekten  mit  unscharfen  Bildern.  Wie  gezeigt  wurde,  besitzen  die 
unklaren  Bilder  geringere  Leistungsspektren  im  hohen  Frequenzbereich.  Die  Fo¬ 
kussierung  solcher  Szenen  ist  natiirlich  schwer.  Die  Buchstaben  in  Bild  4.14a 
sind  fokal .  Bild  3.14b  zeigt  die  gleichen  Buchstaben  mit  unscharfen  Konturen, 
man  kann  aber  noch  identifizieren.  Bild  4.14c  und  d  sind  total  unscharf,  man 
kann  die  Buchstaben  nicht  erkennen. 
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8i 1 d  4.14:  Bilder  mit  unscharfen  Konturen. 


Die  MeBergebnisse  demonstrieren,  wenn  die  Buchstaben  erkennbar  sind,  zeigen 
die  Kurve  1  und  die  Kurve  2  eine  gute  Ubereinstimmung  und  erreichen  bei  glei- 
cher  Fokussierungsposition  das  Maximum.  Aber  Kurve  2  ist  deutlich  flacher  als 


Bild  4.15:  VAR  mit  unscharfen  Konturen. 
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Kurve  1  (Bild  4.15).  Weil  Bild  4.14c  und  Bild  4.14d  zu  unscharf  sind,  sind  in 
Kurve  3  und  in  Kurve  4  die  Fahigkeit  zur  Fokussierung  verlorengegangen.  Es  ist 
unmoglich,  diese  beiden  Bilder  mit  Hilfe  der  FF  zu  fokussieren. 

4.6  Per  EinfluB  durch  Starke  Reflexion 

Bei  spiegelnden  Oberflachen  wird  einfallendes  Licht  nur  in  einer  Richtung  re- 
flektiert.  Viele  Objekte  enthalten  einen  Teil  dieser  Reflexionsart,  die  in 
Form  von  Glanzl ichtern  in  den  Bildern  sichtbar  ist.  Diese  Bildteile  sind  fur 
die  Bildverarbeitung  besonders  problematisch,  da  sie  selbst  bei  geringer  Dre- 
hung  des  Objektes  sich  auf  diesem  verschieben  und  daher  ihr  Aussehen  veran- 
dern.  Die  Spiegelung  erfolgt,  wenn  die  Rauhigkeit  klein  gegenuber  den  Wellen- 
langen  des  einfallenden  Lichtes  ist.  Ideale  glatte  Oberflachen  sind  nur  durch 
Kristallspaltflachen  realisiert. 

Als  Spiegel flachen  benutzt  man  Metal!  flachen,  die  meist  aus  Aluminium  Oder 
Silber  bestehen.  Im  vorliegenden  Experiment  wird  Glanzpapier  als  Spiegelflache 
benutzt.  Der  Reflexionsgrad  des  Glanzpapiers  ist  fast  1,  d.h.  das  Glanzpapier 
kann  das  einfallende  Licht  zu  fast  100  %  reflektieren.  In  dieser  Situation  ist 
das  reflektierte  Licht  zu  stark.  Wenn  das  Glanzpapier  keine  Falte  besitzt,  ist 
das  Bild  vom  Glanzpapier  homogen.  Deshalb  kann  die  Fokussierungsfunktion  ein 
solch  homogenes  Bild  nicht  fokussieren.  Wenn  auf  der  Oberflache  des  Glanzpa¬ 
piers  Falten  auftreten,  d.h.  die  Oberflache  des  Glanzpapiers  uneben  ist,  wird 
das  Licht  in  verschiedenen  Richtungen  reflektiert.  Das  Bild  des  Glanzpapiers 
ist  nicht  mehr  homogen. 

Wenn  das  Glanzpapier  mit  Falten  mit  den  globalen  Fokussierungsfunktionen, 
z.  B.  VAR,  zu  fokussieren  ist,  wird  die  Kamera  die  falsche  Fokussierungsposi- 
tion  finden.  Dieses  Phanomen  kann  man  durch  die  Ergebnisse  des  Experiments 
aufdecken.  Kurve  1  in  Bild  4.16  ist  VAR  von  Glanzpapier.  Das  Maximum  ist  nicht 
in  der  besten  Fokussierungsposition  p'  =  150  mm,  sondern  in  der  Position 
p'  =  120  mm  aufgetreten.  In  der  besten  Fokussierungsposition  tritt  die  VAR  als 
ein  lokales  Minimum  auf. 
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Bild  4,16:  Fokussierungsfunktionen  void  Glanzpapier. 

Kurve  2  1st  die  lokale  Fokussierungsfunktion  SMD.  Oas  Maxiumum  in  der  Kurve  2 
1st  genau  in  der  besten  Fokussierungsposition  aufgetreten,  Um  dieses  Phanomen 
zu  erklaren,  werden  die  Bilder  des  Glanzpapiers  in  der  Fokussierungsposition 
p'  =  120  urn  und  p'  =  150  mm  in  Bild  4.17  gezeigt. 


a)  p'  =  120  mm  b)  p'  =  150  mm 

Bild  4.17:  Bild  des  Glanzpapiers  mil  Fallen. 

Das  Bild  von  p'  =  120  mm  besteht  auf  zwei  homogenen  Bereichen.  Ein  Bereich  ist 
schwarz,  der  andere  im  Gegensatz  dazu  ist  weiB.  In  diesem  Bild  ist  der  Kon- 
trast  am  starksten.  Deshalb  erreicht  die  VAR  in  dieser  Position  ihr  Maximum, 
aber  fur  die  lokale  Fokussierungsfunktion  SMD  ist  ihr  Wert  innerhalb  des  homo¬ 
genen  Bereiches  Null.  Nur  in  dem  Obergang  zwischen  beiden  homogenen  Bereichen 
ist  der  Wert  der  SMD  von  Null  verschieden.  Deswegen  hat  SMD  in  der  Position 
p'  =  120  mm  ihren  kleinsten  Wert.  Bild  4.17b  zeigt  das  Bild  vom  Glanzpapier  in 
der  besten  Fokussierungsposition.  in  diesem  Bild  kann  man  die  Textur  des 
Glanzpapiers  erkennen. 
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4.7  Fokussierungsfunktionen  bei  dreidimensionalen  Gebilden 

In  den  bisherigen  Experimenten  sind  die  Oberflachen  der  Objekte  immer  eben. 

Die  ebenen  Oberflachen  sind  von  einer  ideal  glatten  Flache  nur  geringfiigig 
abgewichen  und  haben  eine  niedrige  Rauhigkeit.  Wegen  der  ebenen  Oberflache 
beleuchtet  das  Licht  der  Lichtquelle  die  Szene  uberall.  Deshalb  treten  im  Bild 
keine  Schatten  auf.  Wenn  die  Beleuchtungsstarke  als  konstant  angenommen  wird, 
d.h.  eine  Punktl i chtquel 1 e  im  Unendlichen  existiert,  ist  der  Grauwert  in  der 
Position  (x,y)  nur  vom  Reflexionsgrad  in  diesem  Punkt  abhangig. 

In  diesem  Experiment  werden  die  Fokussierungsfunktionen  bei  dreidimensionalen 
Gebilden  gemessen.  Als  zu  untersuchende  Objekte  werden  folgende  dreidimensio¬ 
nalen  Gebilde  gewahlt: 

•  Mehl, 

•  Sand, 

•  Sesam, 

•  HaselnuB. 

Bild  4.18a  ist  das  Bild  von  Mehl,  dessen  raumliche  Dimension  im  Vergleich  zu 
anderen  Gebilden  sehr  klein  ist.  Im  Bild  ist  keine  Textur  zu  bemerken.  Das 
Bild  besitzt  einen  sehr  schwachen  Kontrast.  Die  Oberflache  der  Szene  mit  Mehl 
ist  ziemlich  flach,  deswegen  treten  in  dem  Bild  auch  keine  Schatten  auf. 

Das  Bild  von  Sand  in  Bild  4.18b  ist  ein  texturreiches  Bild.  Da  die  raumliche 
Dimension  des  Sandes  noch  nicht  groB  genug  ist,  hat  auch  dies  Bild  keinen 
Schatten.  Der  Kontrast  von  Bild  4.18b  ist  zwar  nicht  so  stark,  die  Grauwerte 
der  benachbarten  Bildpunkte  verandern  sich  aber  deutlich.  Deshalb  sind  die 
lokalen  Fokussierungsfunktionen  giinstig  zur  Fokussierung  der  Szene  mit  Sand. 
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Bild  4,18:  Bilder  verschiedener  dreidimensionaler  Gebilde. 

Die  raumliche  Dimension  von  Sesam  ist  im  Vergleich  zum  Sand  sehr  groB.  In  Bild 
4.18c  kann  man  den  Schatten  deutlich  sehen.  Der  Schatten  ist  die  Abbildung  des 
Lichtes  nicht  Oder  weniger  beleuchteter  Teile  einer  Flache,  hervorgerufen 
durch  undurchsichtige  Korper,  die  sich  im  Strahlengang  befinden.  Das  Schatten- 
gebiet  wird  durch  die  Gestalt  des  Korpers  und  die  Gestalt  der  Lichtquelle  be- 
dingt.  Deshalb  spielt  die  Beleuchtungsrichtung  eine  groBe  Rolle  fur  das  Bild 
von  dreidimensionalen  Gebilden.  Wenn  das  Bild  einen  Schatten  hat,  tritt  eine 
Kante  zwischen  den  Schattengebieten  und  den  beleuchteten  Gebieten  auf.  Diese 
Kante  kann  zwar  die  Grauwertfluktuation  im  Bild  verstarken,  besitzt  aber  keine 
Information  uber  den  Fokussierungszustand.  Wenn  das  Schattengebiet  im  Bild 
sehr  grofl  ist,  kann  die  beste  Fokussierungsposition  mit  Hilfe  der  FF  nicht 
gefunden  werden,  Bevor  ein  dreidimensionales  Gebilde  zu  fokussieren  ist,  mufl 
deshalb  die  Beleuchtungsrichtung  so  ausgerichtet  werden,  daB  das 
Schattengebiet  im  Bild  so  klein  wie  moglich  wird. 
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Die  Oberfl ache  von  Sesam  ist  ziemlich  glatt.  Die  Oberflache  im  Bi Id  ist  ein 
homogener  Bereich,  deshalb  tritt  die  Kante  im  Bild  nur  zwischen  zwei  Kornern 
auf. 

Das  letzte  Gebilde  ist  die  HaselnuB.  Die  raumliche  Dimension  der  HaselnuB  ist 
im  Vergleich  zu  den  anderen  Gebilden  sehr  groB.  Deshalb  hat  Bild  4.18d  groBe 
Schattengebiete.  Die  Oberflache  der  HaselnuB  ist  sehr  rauh.  Die  groBe  Rauhig- 
keit  der  Oberflache  kann  zur  Fokussierung  des  Objektes  hilfreich  sein. 

Bild  4.19a  zeigt  die  globale  Fokussierungsfunktion  VAR.  Wenn  die  Szene  aus 
Mehl  besteht,  ist  die  Grauwertfluktuation  sehr  klein.  Kurve  1  ist  die  VAR  vom 
Mehl  und  hat  keine  unimodulare  Eigenschaft  mehr,  d.h.  die  globalen  Fokussie- 
rungsfunktionen  sind  ungeeignet  zur  Fokussierung  dieses  kontrastarmen  Bildes. 


Bild  4.19a:  VAR  bei  verschiedenen  dreidimensionalen  Gebilden. 

Kurve  4  ist  die  VAR  der  HaselnuB.  Zwar  verlauft  die  Kurve  in  die  beste  Fokus- 
sierungsposition  eines  lokalen  Maximums,  aber  das  globale  Maximum  befindet 
sich  am  Anfang  des  Fokussierungsbereiches.  In  Kurve  2  und  Kurve  3  erscheint 
das  Maximum  in  der  besten  Fokussierungsposition,  aber  diese  beiden  Kurven  sind 
zu  flach. 
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Die  Grauwerte  in  diesem  Bild  verandern  sich  regelmSBig.  Bi Id  4.20b  zeigt  das 
Bild  der  Haut  einer  Handflache.  Man  kann  die  Richtung  der  Grauwerte  deutlich 
erkennen.  Beide  Bilder  sind  arm  an  Kontrast,  deshalb  sind  nur  die  lokalen  Fo- 
kussierungsfunktionen  zu  benutzen,  urn  die  Haut  zu  fokussieren.  Die  Ergebnisse 
sind  in  Bild  4.21  dargestellt. 


Bild  4.21:  SMD  der  menschlichen  Haut. 

4l.8  Fokussierunqsfunktionen  von  schwarz-weiB  Mustern  unterschieril irher 
Grautonuna 

Dieses  Experiment  ist  zur  Untersuchung  des  Einflusses  des  Kontrastes  vom  Ob- 
jekt  entworfen  worden.  Die  Objekte  sind  die  Gitter  auf  dent  weiBen  Papier.  Es 
ist  klar,  daB  der  Grauwert  des  weiBen  Papiers  sehr  groB  ist.  Der  Grauwert  der 
Gitter  wird  verandert,  damit  man  die  schwarz-weiB  Muster  mit  unterschiedl icher 
Grautonung  bekommen  kann.  Die  Grauwerte  der  Gitter  haben  drei  Stufen,  namlich 
0,  100  und  200. 
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Bild  4.22:  Schwarz-weiB  Muster  unterschiedlicher  Grautonung. 

Wenn  die  Grauwerte  der  Sitter  Null  sind,  hat  das  Bild  den  starksten  Kontrast 
1m  Segensatz  dazu  ist  beim  Grauwert  200  der  Kontrast  des  Musters  am  schwach 
sten. 


Bild  4.23:  VAR  van  schwarz-weiB  Mustern  unterschiedlicher  Grautonung 
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Die  Ergebnisse  sind  klar.  Je  starker  der  Kontrast  des  Objektes  1st,  desto  bes- 
ser  fur  die  Fokussierung.  Wenn  der  Kontrast  des  Objektes  zu  schwach  1st,  kann 
das  Objekt  nicht  mit  Hilfe  der  FF  fokussiert  werden. 

4.9  Zusammenfassunq 

Es  wurden  Experimente  zur  Untersuchung  der  Eigenschaften  von  verschiedenen 
Fokussierungsfunktionen  durchgefiihrt.  Durch  diese  Experimente  werden  die 
Vorteile  und  Nachteile  der  Fokussierungsfunktionen  unter  folgenden  Aspekten 
beurteilt: 

1.  Kompliziertheit  der  Fokussierungsfunktionen. 

Alle  Fokussierungsfunktionen  auBer  der  Fokussierungsfunktion  LS  haben  ein- 
fache  Algorithmen.  Zur  Berechnung  des  Leistungsspektrums  vom  Bild  ist  eine 
zweidimensionale  Fouriertransformation  durchzuftihren.  Urn  Rechenzeit  zu  spa- 
ren,  wird  ein  Algorithmus  der  schnellen  Fouriertransformation  (FFT)  verwen- 
det.  Die  FFT  ist  ein  relativ  aufwendiger  Algorithmus. 

Durch  die  Ableitung  der  Varianz  als  Fokussierungsfunktion  wird  die  Storung 
des  optischen  Systems  stark  hervorgehoben.  Urn  dieses  Problem  zu  losen,  wird 
ein  digitales  Filter  benutzt.  Die  Benutzung  des  digitalen  Filters  verur- 
sacht  allerdings  eine  Verzogerung  der  besten  Fokussierungsposition.  Diese 
Verzogerung  kann  zwar  vorhergesagt  und  durch  das  Programm  kompensiert  wer¬ 
den,  aber  das  Programm  zur  Kompensierung  der  Verzogerung  und  der  Algorith¬ 
mus  des  digitalen  Filters  verkomplizieren  das  Fokussierungsverfahren.  Des- 
halb  ist  die  Ableitung  der  Varianz  als  FF  gegenuber  der  Varianz  selbst  ein 
kompl izierterer  Algorithmus. 
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2.  Die  Recbenzeit  der  Fokussierungsfunktionen. 

Die  Rechenzeit  1st  nicht  so  wichtig  wie  die  Genauigkeit  der  FF,  Aber  fur 
eine  gute  FF  1st  die  Rechenzeit  sehr  kurz.  Die  Rechenzeit  der  verschiedenen 
FF  sind  in  folgender  Tabelle  gezeigt. 


FF 

VAR 

ENT 

SMB 

LS 

SL 

TV 

LO 

Rechen- 

Zelt(s) 

0,24 

0,23 

0,32 

1,00 

0,68 

0,20 

0,36 

Tab,  4.1;  Rechenzeit  der  verschiedenen  Fokussierungsfunktionen, 

Die  Rechnung  fur  TV  braucht  nur  einfache  arithmetische  Entscheidungen 
durchzufuhren,  Desha! b  ist  die  Rechenzeit  von  TV  am  kurzesten. 

Um  die  VAR  und  die  ENT  zu  berechnen,  braucht  der  Computer  0,24  s  bzw. 

0,23  s.  Da  die  Rechnung  von  VAR  und  ENT  das  Histogramm  des  Bildes  benutzt 
hat,  ist  die  Rechenzeit  sehr  kurz. 

IS  ist  eine  zeitraubende  Fokussierungsfunktion.  Obwohl  die  Anzah!  der 
benutzten  Bildpunkte  geringer  als  bei  anderen  Fokussierungsfunktionen  ist, 
betragt  die  Rechenzeit  fur  LS  1  s. 

Wei!  fur  die  Berechnung  von  SL'  die  Gleitkommazahlen  mit  doppelter  Genauig- 
keit  benotigt  werden,  ist  die  Rechenzeit  ziemlich  lang  (0,68  s). 

3.  Anpassungsvermogen  der  FF  an  Objekte. 

In  den  Experimenten  wurden  sowoh!  Objekte  von  kiinstlichen  Mustern  mit  re¬ 
gel  maBi  gen  Texturen  als  auch  Objekte  von  naturlichen  Mustern  (dreidimensio- 
nale  Gebilde)  mit  Gberwiegend  unregelmaBigen  Texturen  verwendet.  Die  Ergeb- 
nisse  zeigen,  daB  die  Fokussierungsfunktion  SMD3  und  LO  die  besten  Anpas¬ 
sungsvermogen  an  die  verschiedenen  Objekte  haben.  SMD1  ist  ungeeignet  zur 
Fokussierung  des  Objektes  mit  der  Kante  entlang  der  y-Richtung.  SMD2  kann 
das  Objekt  mit  der  Kante  entlang  der  x-Richtung  nicht  fokussieren. 
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Die  Fokussierungsfunktion  ENT  versagt  vollstandig  bei  Bildern,  in  denen 
wenige  Grauwerte  gehauft  auftreten.  Die  globalen  Fokussierungsfunktionen 
VAR,  LS,  TV  sind  schlecht  zur  Fokussierung  der  Objekte  mit  schwachem  Kon- 
trast.  Diese  drei  Fokussierungsfunktionen  sind  ungunstig  zur  Fokussierung 
der  dreidimensionalen  Gebilde. 

4.  Genauigkeit  der  Fokussierungsfunktionen. 

Um  die  Genauigkeit  der  FF  zu  beurteilen,  wurde  folgendes  Experiment  durch- 
gefuhrt:  Die  Kamera  fokussiert  ein  bestimmtes  Objekt  mit  alien  Fokussie¬ 
rungsfunktionen.  Fur  jede  FF  wird  der  FokussierungsprozeB  15mal  durchge- 
fiihrt.  Inzwischen  verandert  sich  die  Beleuchtungsstarke.  Jedesmal  wird  die 
gefundene  beste  Fokussierungsposition  p'pt  notiert.  AnschlieBend  werden  die 
durchschnittl iche  beste  Fokussierungsposition  und  die  mittlere  Abweichung 
der  besten  Fokussierungsposition  berechnet.  Die  Ergebnisse  sind  in  Tabelle 
4.2  dargestellt. 


FF 

p'b(mm) 

VAR 

151,14 

1,187 

150-153 

ENT 

153, B6 

0,450 

139-162 

SMD 

151,30 

0,499 

151-152 

LS 

151,86 

2,776 

147-156 

SL 

151,75 

2,026 

148-156 

TV 

151,12 

1,414 

149-154 

LO 

152,23 

0,973 

150-153 

DVAR 

151,92 

1,272 

149-153 

Iflk-  4.2:  Genauigkeit  der  Fokussierungsfunktionen. 

In  Tabelle  4.2  ist  p^  die  durchschnittl iche  beste  Fokussierungsposition 
sie  laBt  sich  mit  folgender  Gleichung  berechnen 

1  15  i 

pd  -Ir.f/'opt  ■ 

pma  ist  die  mittlere  Abweichung  von  der  besten  Fokussierungsfunktion 
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ist  der  Bereich  der  besten  Fokussierungsfunktionen. 

Fur  eine  gute  Fokussierungsfunktion  ist  die  beste  Fokussierungsposition 
immer  in  der  gleichen  Position.  Aber  der  EinfluB  des  Objektes  und  des  Rau- 
schens  auf  die  Fokussierungsfunktion  sind  immer  vorhanden,  wenn  das  opti- 
sche  System  nicht  aberrationsfrei  ist,  was  bei  jedem  realen  optischen  Sy¬ 
stem  der  Fall  ist.  Deshalb  befindet  sich  die  beste  Fokussierungsfunktion 
nicht  in  einer  Position.  Solange  sich  die  Fokussierungsposition  innerhalb 
der  Seharfentiefe  befindet,  wird  diese  Position  als  richtige  Fokussierungs¬ 
position  behandelt,  Wegen  der  Auflosung  des  menschlichen  Auges  ist  die  Fo¬ 
kussierungsposition  zwischen  149  m  und  152  mm  die  richtige  Fokussierungs¬ 
position  im  beschriebenen  System. 


Fur  alle  Fokussierungsfunktionen  auBer  der  ENT  befinden  sich  die  durch- 
schnittlich  besten  Fokussierungspositionen  p^  innerhalb  dieses  Intervalls 
(149  mm  -  152  mm).  Weil  die  (Curve  von  ENT  zu  flach  ist,  verteilt  sich  die 
beste  Fokussierungsfunktion  auf  einen  breiten  Bereich.  Deshalb  kann  ENT  das 
Objekt  nur  grob  fokussieren;  Normal erweise,  wenn  p^a  >  2  mm  ist,  hat  die 
Fokussierungsfunktion  eine  geringere  Genauigkeit.  Die  p^a  von  ENT,  LS  und 
SI  sind  groBer  als  2  mm.  Die  (Curve  von  LO  hat  eine  scharfere  Spitze,  des¬ 
halb  ist  die  Genauigkeit  von  LO  am  besten.  Die  Fokussierungsfunktionen  VAR, 
SMD  und  TV  haben  auch  sehr  gute  Genauigkeiten. 

5.  Zuverlassigkeit  der  Fokussierungsfunktionen. 

Die  gute  Fokussierungsfunktion  hat  eine  starke  Storfestigkeit.  Der  EinfluB 
auBerer  Bedingungen  fur  die  Fokussierung  ist  nicht  empfindlich,  aber  nur 
VAR  und  SMD  gehoren  zur  (Classe  solcher  Fokussierungsfunktionen.  Fur  ENT 
spielen  die  Beleuchtungsstarke  und  die  Beleuchtungsrichtung  eine  groBe  Rol¬ 
ls;  IS,  TV,  SL  und  LO  sind  auch  sehr  empfindlich  gegenuber  der  Beleuch¬ 
tungsstarke.  Wenn  die  Beleuchtungsstarke  zu  klein  ist,  werden  die  Objekte 
falsch  fokussiert. 

6.  (Curven  der  Fokussierungsfunktionen. 

Eine  gute  Fokussierungsfunktion  hat  folgende  Eigenschaften: 

a.  Die  (Curve  der  FF  ist  glatt.  Das  bedeutet,  dafi  der  EinfluB  des  Rauschens 
klein  ist. 
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b.  In  der  Nahe  der  besten  Fokussierungsposition  verandert  sich  die  FF  sehr 
schnell.  Deshalb  ist  die  Genauigkeit  der  FF  hoch. 

c.  Die  Breite  des  wirksamen  Bereiches  der  Kamera  ist  groB,  damit  die  Kamera 
in  einem  groBem  Arbeitsbereich  fokussieren  kann. 


gild  4.24:  Kurven  verschiedener  Fokussierungsfunktionen. 


Bild  4.25:  Kurven  verschiedener  Fokussierungsfunktionen. 

Bild  4.24  und  Bild  4.25  zeigen  die  Kurven  von  alien  FF.  Als  Objekt  dient 
das  Muster  Honig.  Die  Kurven  von  VAR,  SMD  und  TV  haben  alle  oben  erwahnten 
Eigenschaften.  Die  Kurve  von  ENT  ist  zwar  glatt,  aber  die  Spitze  ist  zu 
fl ach. 

Weil  die  Berechnung  des  Leistungsspektrums  wenige  Bildpunkte  benutzt,  ist 
der  EinfluB  des  Rauschens  sehr  groB,  besonders  im  unwirksamen  Bereich  der 
Kamera. 
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Die  Fokussierungsfunktion  SL*  hat  in  der  besten  Fokussierungsposition  kein 

Maximum,  sondern  ein  Minimum.  Die  Kurve  von  SL#  1st  auch  flach. 

Die  Kurve  von  LO  verandert  sich  in  der  Nahe  der  besten  Fokussierungsposi- 

tion  zwar  sehr  schnell,  die  Breite  der  Spitze  ist  aber  zu  eng.  Deshalb  1st 

der  Arbeitsbereich  der  Kamera  sehr  klein. 

Aus  der  o.  g.  Diskussion  kann  man  zusammenfassen: 

a.  SMD  1st  die  beste  FF.  VAR,  TV  und  LO  sind  auch  gunstige  Fokussie- 
rungsfunktionen. 

b.  IS  und  SL'  sind  zu  Ungsam  zur  Fokussierung.  AuBerdem  ist  ihre  Senauig- 
kelt  schlecht. 

c.  Die  Fokussierungsfunktion  ENT  ist  zwar  schnell,  aber  ihre  Senauigkeit 
1st  zu  schlecht. 

d.  Das  Differential  der  Varianz  als  Fokussierungsfunktion  weist  gegeniiber 
der  Varianz  keine  Vorteile  auf. 
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5.  Fokussierung  von  Bildausschnitten 

5.1  Grundidee  der  Fokussieruno  von  Bildausschnitten 

Die  Szene  besteht  normal erweise  aus  verschiedenen  Objekten,  die  sich  nicht 
immer  in  einer  Ebene  befinden.  Deshalb  sind  die  Objektweiten  dieser  Objekte 
unterschiedl ich.  Sogar  die  Oberflache  eines  Objektes  ist  nicht  flach.  Wenn  wir 
die  Oberflache  des  Objektes  in  verschiedene  Regionen  aufteilen,  sind  die  Ab- 
stande  zwischen  der  Linse  der  Kamera  und  solchen  Regionen  unterschiedlich. 
Solange  sich  alle  Objekte  in  der  Szene  nicht  im  Scharfentiefenbereich  der  Ka¬ 
mera  befinden,  kann  die  Kamera  solche  Objekte  nicht  gleichzeitig  im  Fokus  ha- 
ben,  z.B.  wenn  man  zwei  Gebaude  fotografiert,  die  verschieden  weit  von  der 
Kamera  entfernt  sind.  Wenn  die  Kamera  so  eingestellt  wird,  daB  das  Bild  eines 
Gebaudes  scharf  ist,  ist  das  des  anderen  vielleicht  nicht  immer  scharf. 

Die  oben  erwahnten  Fokussierungsfunktionen  sind  zur  Fokussierung  des  Objektes 
mit  flacher  Oberflache  entworfen.  Urn  die  Genauigkeit  der  Fokussierung  zu  ga- 
rantieren,  werden  die  benutzten  Bildpunkte  sich  im  ganzen  Bild  verteilen.  Des¬ 
halb  drucken  die  Fokussierungsfunktionen  den  Fokussierungszustand  des  ganzen 
Bildes  aus.  Wenn  die  Szene  verschieden  weit  von  der  Linse  der  Kamera  entfernt 
ist,  werden  die  Fokussierungsfunktionen  mehrere  Maxima  in  verschiedenen  Posi- 
tionen  haben. 


Bild  5.1;  SMD  eines  Objektes  mit  Tiefensprung. 
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Blld  5.1  zeigt  die  SMD  eines  Objektes  mil  einem  Tiefensprung.  Die  OberfUche 
dieses  Objektes  besteht  aus  zwei  Flacben.  Die  Gbjektweiten  von  beiden  Flachen 
sind  unterschiedlich.  Deshalb  treten  bei  der  SMD  zwei  lokale  Extremwerte  in 
den  Positionen  p'pU  und  p^pt2  in  der  Kurve  1  auf.  Die  Kamera  kann  aber  nur 
einmal  eine  Flache  fokussieren.  Normal erweise  wird  mit  Hilfe  der  Fokussie- 
rungsfunktion  die  Position  des  ersten  Extremwertes  als  die  beste  Fokussie- 
rungsposition  gefunden.  Solange  sich  die  beiden  Flacben  nicht  im  Scharfentie- 
fenbereich  der  Kamera  befinden,  hat  die  Fokussierungsfunktion  zwei  lokale  Ex- 
tremwerte  (Kurve  1  in  Bild  5.1).  Durch  die  Positionen  der  beiden  Extremwerte 
kann  man  den  Abstand  der  beiden  Flachen  bestimmen.  In  Kurve  1  ist  p'ptl  -  H7 
m  und  p*pt2  -  168  mm*  deshalb  sind  die  beiden  Flachen  21  mm  voneinander  ent- 
fernt.  Venn  beide  Flachen  im  Scharfentiefenbereich  der  Kamera  liegen*  tritt 
bei  der  Fokussierungsfunktion  nur  ein  Maximum  auf*  aber  die  Kurve  der  FF  in 
der  Nahe  der  besten  Fokussierungsposition  ist  sehr  flach  (Kurve  2  in  Bild 
5.1). 


Durch  die  o.  g.  Analyse  kann  man  erkennen:  wenn  die  benutzten  Bildpunkte  sich 
im  ganzen  Bild  verteilen,  ist  die  Fokussierung  der  Szene  mit  verschiedenen 
Objektweiten  unmoglich.  Urn  irgendwo  das  Objekt  zu  fokussieren,  muS  zuerst  die 
zu  fokussierende  Position  ausgewahlt  werden.  Die  Berechnung  der  FF  benutzt  nur 
die  Bildpunkte  in  der  Umgebung  dieser  Position.  Es  werden  so  wenig  wie  moglich 
Bildpunkte  benutzt*  damit  die  Fokussierungsfunktion  weniger  von  anderen  Fla¬ 
chen  beeinfluBt  wird. 

Um  die  zu  fokussierende  Position  des  Objektes  zu  bestimmen*  muB  das  Objekt 
zuerst  grob  fokussiert  werden.  Durch  die  grobe  Fokussierung  bekommt  man  ein 
unscharfes  Bild  des  Objektes.  Mit  Hilfe  dieses  unscharfen  Bildes  wird  die  zu 
fokussierende  Position  ausgewihlt  und  deren  Koordinaten  (x,y)  eingegeben.  In 
GauB'scher  Naherung  [17]  soil  jedem  Bildpunkt  die  entsprechende  Position  vom 
Objekt  zugeordnet  werden.  Nach  der  Eingabe  der  Koordinaten  (x,y)  berechnet  der 
Computer  die  Fokussierungsfunktion  mit  den  Grauwerten  des  quadratischen  Umge- 
bungsfensters  von  (x,y).  Wegen  des  guten  Charaktes  wird  die  SMD  zur  Fokussie¬ 
rung  der  relativen  Position  benutzt. 
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Nach  der  Wahl  der  Fokussierungsfunktion  ist  es  wichtig,  die  GroBe  der  benutz- 
ten  Bildpunkte  festzulegen.  Sind  es  zu  wenig  Bildpunkte,  wird  die  Fokussie¬ 
rungsfunktion  durch  Rauschen  stark  beeinfluBt.  Die  GroBe  der  benutzten  Bild¬ 
punkte  wird  durch  folgendes  Experiment  bestimmt. 

Im  Experiment  werden  die  Kurven  der  SMD  fur  verschiedene  GroBen  der  benutzten 
Bildpunkte  gemessen.  Als  GroBen  werden  folgende  vier  Fall e  betrachtet: 


a) 

16  x 

16  = 

256  (Bildpunkte) 

b) 

32  x 

32  = 

1024  (Bildpunkte) 

c) 

64  x 

64  = 

4096  (Bildpunkte) 

d) 

128  x 

128  = 

16384  (Bildpunkte) 

1,0 
0,8 
0,6 
0,4 
0,2 
0,0 

Bild  5.2:  SMD  fur  verschiedene  Anzahl  von  Bildpunkten. 

Die  Kurve  1  in  Bild  5.2  zeigt  die  SMD  bei  der  GroBe  16  x  16.  Weil  die  Berech- 
nung  der  SMD  zu  wenige  Bildpunkte  benutzt  hat,  tritt  die  Kurve  in  der  besten 
Fokussierungsposition  zwar  als  Maximum  auf,  sie  hat  aber  groBe  Schwingungen  im 
unwirksamen  Bereich  der  Kamera.  Diese  Schwingungen  konnen  den  Fokussierungs- 
prozeB  unterbrechen.  Wenn  die  GroBe  der  benutztzen  Bildpunkte  128  x  128  ist, 
kann  der  EinfluB  des  Rauschens  vernachlassigt  werden  (Kurve  4),  aber  fur  die 
Fokussierung  einer  relativen  Position  sind  128  x  128  Bildpunkte  zu  viel. 

Kurve  2  und  Kurve  3  in  Bild  5.2  entsprechen  der  SMD  von  32  x  32  und  64  x  64 
Bildpunkten.  In  beiden  Kurven  sind  die  Einfliisse  des  Rauschens  im  Vergleich 
zur  Kurve  1  schwach.  Deshalb  wird  als  GroBe  der  Bildpunkte  32  x  32  gewahlt. 
Durch  die  Vorverarbeitung  der  Bilder  kann  damit  der  EinfluB  des  Rauschens  ver- 
mieden  oder  zumindest  verringert  werden. 


-  90  - 


S.g  Vorverarbeituno  zur  Reduzierung  des  Rauscheinflusses 

Bel  den  meisten  Diskussionen  iiber  Fokussierungsalgorithmen  wird  angenommen, 
da8  es  moglich  ist,  die  exakte  Beziehung  zwischen  dent  Objekt  und  dessen  Bild 
zu  kennen  [18].  Ungliicklicherweise  sind  alle  Bilder  aber  iramer  durch  das  Rau- 
schen  verfalscht.  Bilder  werden  gewohnlich  wahrend  ihrer  Erzeugung  durch  das 
abbildende  System  durch  zufallige  Storungen,  d.h.  Rauschen,  beeinfluBt.  Der 
Beitrag  des  Rauschens  kommt  aus  folgenden  Quellen;  das  Schrotrauschen  1m  Sen¬ 
sor,  das  thermische  Rauschen  in  den  Verstarkungsbestandteilen, 

Oen  realen  Grund  zur  Bildvorverarbeitung  vor  der  eigentlichen  Berechnung  der 
Fokussierungsfunktion  kann  man  durch  die  Fokussierungsstrategie  deutlich  er- 
kennen,  Alle  Fokussierungskriterien  haben  namlich  eine  gemeinsame  Elgenschaft, 
sie  sind  abhangig  von  den  Fokussierungsfunktionen,  die  ein  Maximum  oder  Mini- 
mun  in  der  besten  Fokussierungsposition  haben.  Die  Fokussierungsstrategie  ist 
also  so,  dafi  der  Computer  die  Fokussierungsfunktion  berechnet  und  die  Position 
der  Kamera  verandert.  Dann  berechnet  der  Computer  die  FF  nochmal  und  ver- 
gleicht  die  FF  in  beiden  Positionen.  Wenn  die  FF  abnimmt,  fahrt  die  Kamera 
zuruck,  sonst  fahrt  die  Kamera  vor  und  zwar  soweit,  bis  die  beste  Fokussie¬ 
rungsposition  gefunden  ist. 

Es  wird  angenommen,  daB  wegen  des  Rauscheinflusses  die  FF  ein  lokales  Maximum 
vor  der  besten  Fokussierungsposition  hat.  In  diesem  Fall  wird  diese  Position 
als  beste  Fokussierungsposition  gefunden. 

Urn  effektive  Algorithmen  fur  die  Bildvorverarbeitung  auslegen  zu  konnen,  muB 
man  die  Ursachen  des  Bildrauschens  und  ihre  Auswirkungen  auf  den  vollstandig 
digital isierten  Sensorausgang  kennen.  Die  Bildvorverarbeitung  besteht  im  we- 
sentlichen  aus  einem  AbschatzungsprozeB,  mit  dem  ein  "ideales*  Bild  erzeugt 
werden  soil,  aus  dem  alle  Einflusse  des  Rauschens  entfernt  worden  sind  (Bild 
5.3}  und  basiert  darauf,  ein  rekonstruiertes  Bild  gf(x,y)  zu  erzeugen,  das  eng 
mit  dem  unverrauschen  Bild  gQ{x,y)  in  Beziehung  steht,  das  der  Sensor  erzeugt 
hat. 
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Kamerasystem 


1  reales 
\  1  Bild 

Bildvorver- 

vorverarbei- 
teles  Bild 

'  j  gU.y) 

arbeitung 

g’(*.y) 

Bi  1  d  5.3:  Blockschaltbild  eines  typischen  Bildsystems . 

Es  gibt  zwei  Haupttypen  des  Rauschens: 

a)  Additives  Rauschen. 

Das  Model  1  des  additiven  Rauschens  verwendet  man  dann,  wenn  das  Bild  am  Aus- 
gang  des  Systems  oder  nach  einem  beliebigen  Transformationsschritt  als  Summe 
des  unverrauschten  Bildes  und  eines  zufalligen  Rauschens  betrachtet  werden 
kann.  Damit  kann  bei spiel sweise  die  Wirkung  des  Schrotrauschens  im  Sensor  und 
des  thermischen  Rauschens  in  den  Verstarkungsbestandteilen  beschrieben  werden. 

Wenn  sich  die  Wirkung  des  Rauschens  nicht  iiber  das  ganze  Bild  erstreckt,  son- 
dern  nur  an  zufallig  verteilten  Bildpunkten  existiert,  an  denen  sich  der  Grau- 
wert  urn  eine  zufallige  GroBe  andert,  nennt  man  dies  Impulsrauschen.  Impulsrau- 
schen  ist  eine  Art  von  additivem  Rauschen  und  ist  charakteristisch  fur  Systeme 
zur  Bildubertragung  mittels  nichtl inearer  Modul ationsarten  (Frequenzmodula- 
tion,  Pul sdauermodulation  usw.)  auf  Funkkanalen  und  digitalen  Systemen  zur 
Bildubertragung  und  -speicherung. 

Additives  Rauschen  beeinfluBt  den  Grauwert  jedes  Bildpunktes  unabhangig  von- 
einander  {d.h.  es  verandert  die  Graustufe  des  individuellen  Punktes). 

b)  Multipl ikati ves  Rauschen. 

Das  multipl ikati ve  Model 1  wird  dann  angewandt,  wenn  man  annehmen  kann,  daB  das 
Bild  mit  dem  zufalligen  Rauschen  multipl iziert  wird.  Das  ist  z.B.  in  erster 
Naherung  der  Fall  beim  Rauschen  von  Sekundarelektronenvervielfachern  und  beim 
Diffusionsrauschen  in  koharent-optischen  und  holographischen  Abbildungssyste- 
men.  Das  multipl ikative  Rauschen  beeinfluBt  die  Grauwerte  mehrerer  Bildpunkte 


-  92  - 


gleichzeitig.  In  der  vorliegenden  Arbeit  steht  das  additive  Rauschen  im 
Mittelpunkt  der  Betrachtungen. 

Zur  Berucksichtigung  dieses  Rauschens  ist  es  notwendig,  die  statistischen 
Charakteristika  des  Rauschens  zu  kennen.  Manchmal  kann  man  diese  Charakte- 
rlstlka  bestimmen,  wenn  man  von  der  Struktur  und  den  Charakteristika  des  opti- 
schen  Systems  ausgeht.  Beim  Fehlen  soldier  Daten  ist  eine  AbschStzung  der 
Rauschcharakteristik  aus  schon  erzeugten  Bildern  Oder  aus  einem  Satz  von  Bil- 
dern  mit  homogenem  Rauschen  notwendig.  In  solchen  Fallen  mussen  die  statisti¬ 
schen  Charakteristika  des  Rauschens  aus  der  Messung  der  statistischen  Charak¬ 
teristika  des  beobachteten  Bildes  abgeleitet  werden. 

Um  die  Rauschparameter  im  beobachteten  Gemisch  zu  schatzen,  ist  es  notwendig. 
Signal  und  Rauschen  im  Bild  zu  trennen.  Dies  ist  wiederum  nur  moglich,  wenn 
man  die  statistischen  Parameter  vom  Signal  und  Rauschen  kennt. 

61 ucklicherweise  ist  jedoch  in  der  Hehrzahl  der  praktischen  Falle  das  Rau¬ 
schen,  das  im  Bild  zu  unterdrucken  ist,  im  statistischen  Sinn  sehr  einfach. 

Das  Rauschen  kann  durch  eine  geringe  Zahl  von  Parametern  beschrieben  werden. 
Daher  laBt  sich  diese  vereinfachte  Aufgabe  der  Parameterschatzung  des  Rau¬ 
schens  selbst  bei  einer  sehr  groben  und  nicht  sehr  detaillierten  a  priori  Vor- 
gabe  der  statistischen  Parameter  des  gemessenen  Bildes  mit  relativ  einfachen 
Hitteln  losen.  Es  ist  lediglich  notwendig,  aus  alien  der  Messung  zuganglichen 
statistischen  Signal paramtern  diejenigen  auszuwahlen,  in  denen  die  Storung  des 
Bildes  durch  das  Rauschen  in  moglichst  einfach  nachweisbarem  anormalem 
Verbal  ten  zum  Ausdruck  kommt. 

«eil  die  Analysierung  der  Auswirkung  des  Rauschens  in  vielen  Fallen  moglich 
ist,  kann  man  die  Auswirkung  des  Rauschens  verringern. 
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1)  Raumliche  Glattung. 

Die  meisten  Bildvorverarbeitungstechniken  basieren  auf  digitaler  Filtering, 
d.h.  auf  der  Eliminierung  unerwiinschter  Effekte  aus  dem  "realen"  Bild,  das  der 
Sensor  und  das  optische  System  liefern  [19].  Die  Glattung  der  Grauwerte  eines 
Bildes  ist  eine  Art  der  digitalen  Filterung.  Die  einfachste  Form  der  Glattung 
der  Grauwerte  eines  Bildes  ist  die  Berechnung  des  Mittelwertes  einer  vorgege- 
benen  Umgebung  eines  Bildpunktes.  Aus  Grunden  der  Symmetrie  wird  meistens  eine 
quadratische  Umgebung  verwendet.  Die  GroBe  des  quadratischen  Umgebungsfensters 
wird  mit  mxm  bezeichnet.  Der  Operator 

k  k 

g'tx.yJ-ij-E  E  g(x-x.y-J)  (5.1) 

^  X=-k  y=-k 

mit  m  =  3,  5,  7,  ...  und  k  =  (m- 1 )/2  weist  dem  Bildpunkt  g'(x,y)  den  Mittel- 
wert  der  mxm-Umgebung  des  Bildpunktes  g(x,y)  als  neuen  Grauwert  zu.  Fur  die 
meisten  Falle  ist  m  =  3,  dann  werden  folgende  Bildpunkte  in  die  Berechnung 
einbezogen: 

9(x-l,y-l)  ,  g(x- 1 ,y)  ,  g(x-l,y+l)  , 

9(x,y-l)  ,  g(x,y)  ,  g(x,y+l) 

g(x+l,y-l)  ,  g(x+l,y)  ,  g(x+l ,y+l )  . 

Bilder,  die  mit  diesem  Operator,  der  auch  bewegter  Mittelwert  genanrrt  wird, 
verarbeitet  werden,  wirken  im  Vergleich  zum  Original  weicher  oder  etwas  un- 
scharfer.  In  Bildbereichen  mit  homogenen  Grauwerten  hat  der  bewegte  Mittelwert 
keine  Auswirkung,  wogegen  Grauwertubergange  geglattet  werden.  Durch  die  raum¬ 
liche  Filterung  (5.1)  wird  das  dem  originalen  Bild  uberlagerte  Rauschen  ver- 
ringert.  Dies  la8t  sich  rechnerisch  nachweisen.  Es  wird  angenommen,  daB  dem 
originalen  Bild  G  ein  Rauschanteil  additiv  iiberlagert  ist: 

g(x,y)  =  g0(x,y)  +  z(x,y)  .  (5.2) 

Der  Rauschanteil  z(x,y)  wird  durch  Zufallsvariable  Z^x  y j  beschrieben,  die  den 

Erwartungswert  0  und  die  Streuung  o2  haben.  Die  Streuung  des  Rauschens  wird 
auch  als  Rauschleistung  bezeichnet.  Die  Zufallsvariablen  seien  unabhangig  und 


unkorreliert.  Damit  ISSt  sich  fur  g#(x,y)  schreiben: 


1 


g#(x*y)  -  ~y 


k  k  k  k 

E  E  g0(x-x,y-y}  +  E  E  z(x-x,y-y) 


m  ^  x=-k  y=-k 

Fur  den  Erwartungswert  und  die  Streuung  der  Zufallsvariablen 

1  =  12*  1  2{x-x,y-y) 

m  J=-k  y=-k 


C5.3) 


ergibt  sich: 


E(Z)  =  E 


k  k 


m2VEk  y--k  Z(*-5.y-5) 


k  k 


V  S  E  EL 
m2  x=-k  y=-k  »•  ^ 


A*  I 

-x»y-y)J 


{5.4} 


mn  =  e 


|\.  E  E  1,  ~ 
U25=-kv=-k 


m  x=-k  y=-k 
k  k 


S  1  Z(x-x,y-y)] 


1#V  »  , 

x=-k  y=-k 


,  k  k 
V  E  E  E 
m  x=-k  y=-k 


[Z(x-x,y-y(] 


1  S2 

1 

m 


(5.5) 


Die  Bezlehungen  (5.4)  und  (5.5)  bestatigen  die  obigen  Vermutungen :  Der  Erwar¬ 
tungswert  bleibt  erhalten  und  die  Streuung  des  Rauschanteils  wi rd  urn  den 
5 

Faktor  1/m  reduziert. 

Der  gleitende  Hittelwert  kann  aueh  als  Faltungsoperation  aufgefaBt  werden.  Da 
beim  gleitenden  Hittelwert  nur  uber  eine  endliche  mxm-Umgebung  des  Bildes 
gemittelt  wird,  kann  (5.2)  als  Faltung  des  Bildausschnittes  mit  einer  Haske 

H  =[h{x,y}]  geschrieben  werden: 
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Die  Maske  ij  hat  beim  gleitenden  Mittelwert  mit  m  =  3  das  Aussehen 


i  i  r 

H  =  [h(x,y)]  =111 
1  1  1. 

Die  zwei  anderen  Masken,  die  haufig  zur  raumlichen  Glattung  benutzt  werden, 
haben  das  Aussehen 

0  2.25  0  ' 

Hj  =  2.25  0  2.25 

0  2.25  0  . 

1.125  1.125  1.125 

H2  =  1.125  0  1.125 

[1.125  1.125  1.125 

Setzt  man  Hj  und  H2  in  Gleichung  (5.6)  ein,  ergibt  sich 


g'(x,y)  = 


)+g{x,y+l)+g(x+l 


g'(x,y)  = 


)+g(x,y+l  + 


Die  Auswirkung  der  raumlichen  Glattung  kann  einfach  mit  Hilfe  des  Laplace- 
Operators  erklart  werden.  Der  Grauwert  eines  Bildes  ist  die  Funktion  von  zwei 
Ortsvariablen  (x,y).  Es  ist  angenommen,  daB  diese  Funktion  eine  Oberflache  im 
dreidimensionalen  Raum  ist.  Zur  Reduzierung  des  Rauschens  braucht  man  nur  die 
Krtimmung  der  Oberflache  in  jedem  Punkt  zu  verringern.  Am  besten  ist  es,  wenn 
diese  Krummung  Null  ist.  Das  wird  genau  dann  passieren,  wenn  der 
Lapl ace-Operator  gleich  Null  ist,  also 


v  g(x,y)  = 
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Ole  Approximation  der  zweiten  Ableitung  lautet: 

32g(*ili  „  g(x+ity)  -  2*g(x»y)  +  g(x-I,y)  , 
dx 


2 

8  -  g(x,y+l)  -  2*g(x,y)  +  g(x,y-l)  . 

Setzt  man  32g(x,y)/3x2  und  32g(x,y)/3y2  in  (5.9)  ein,  ergibt  sich  die 
Gleichung  (5.7). 

Der  Hauptnachteil  der  raumlichen  Glattung  ist  ihre  Tendenz  zur  Trubung  des 
Bildes.  Dies  ist  besonders  schlimm  fur  den  FokussierungsprozeB.  Alle  oben  er- 
wihnten  Glattungsalgorithmen  funktionieren  namlich  als  TiefpaBfilter. 

Die  Auswirkung  der  Glattung  erkennt  man  in  Bi Id  5.4.  Es  zeigt  die  Fokussie- 
rungsfunktion  vor  und  nach  der  raumlichen  Glattung. 


end  5.4:  SMD  vor  und  nach  der  raumlichen  Glattung. 

Kurve  1  zeigt  die  SMD  des  originalen  Bildes,  das  nicht  durch  raumliche  Glat¬ 
tung  behandelt  ist.  Deswegen  hat  sie  groBe  Schwingungen  im  unwirksamen  Bereich 
der  Kamera.  In  Kurve  2  ist  die  SMD  nach  der  raumlichen  Glattung  mit  (5,4)  ge- 
zeigt.  Die  Schwingungen  in  Kurve  2  sind  deutlich  verringert,  aber  die  Kurve  2 
ist  im  Vergleich  zur  Kurve  1  flach,  well  durch  die  Glattungsoperation  das  ori¬ 
ginal  e  Bild  verschmiert  wird. 
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2)  Zeitliche  Glattung 

Die  raumliche  Glattung  kann  zwar  den  Rauschanteil  im  Bild  verringern,  hat  je- 
doch  zu  verwaschenen  Kanten  gefuhrt.  Die  zeitliche  Glattung  kann  diesen  Nach- 
teil  vermeiden.  Fur  die  zeitliche  Glattung  wird  ein  Zeitreihenbild 
£  =  [g(x,y,t)],  t  =  0,  1,  T  -  1,  vorausgesetzt.  Es  kann  sich  dabei  z.B. 
um  eine  Bildsequenz  handeln,  die  von  einer  CCD-Kamera  erzeugt  wird,  die  fest 
install iert  ist  und  einen  definierten  Bildausschnitt  liefert.  1st  der  Aus- 
schnitt  nicht  bewegt  und  sind  die  Parameter  der  (Camera  unverandert,  so  sind 
die  Zeitreihenbilder  im  wesentlichen  alle  gleich,  bis  auf  das  Rauschen,  das 
durch  die  Aufnahmebedingungen  in  die  Grauwerte  des  Bildes  einflieBt.  Eine 
Glattung  der  zeitlich  aufeinanderfolgenden  Bilder  liefert  dann  ein  Bild,  in 
dem  die  Rauscheinflusse  geringer  sind  (auch  Gaufi'sches  Rauschen  mit  Erwar- 
tungswert  0): 


1  T-! 

g'(x,y)  =  f  S  g(x,y,t) 
*  t=0 


(5.10) 


Das  geglattete  Bild  G'  ist  in  der  Bildqualitat  verbessert,  wobei  die  Glattung 
in  (5.10)  die  Scharfe  des  Bildes  nicht  beeinfluBt  hat. 

Durch  die  zeitliche  Glattung  (5.10)  wird  der  Grauwert  g'(x,y)  in  jedem 
Bildpunkt  durch  die  geglatteten  Grauwerte  g(x,y,t)  im  gleichen  Bildpunkt  zu 
verschiedenen  Zeitpunkten  ersetzt.  Je  langer  die  zeitliche  Glattung  dauert, 
desto  besser  ist  die  Reduzierung  des  Rauschanteils  im  Bild.  Durch  die 
zeitliche  Glattung  kann  die  Streuung  des  Rauschens  um  den  Faktor  1/T  reduziert 
werden.  Der  Grauwert  g(x,y,t)  wird  wieder  in  der  Form 


g(x,y,t)  =  g0(x,y,t)  +  z(x,y,t) 


(5.11) 


angesetzt.  Wiederum  werden  die  Rauschanteile  z(x,y,t)  durch  Zufallsvariable 
Z(x,y,t)  beschrieben-  Dann  1 aBt  sich  fur  g'(x,y)  schreiben: 


g'(x,y) 


1 

r 


T-l 

i 

t=0 


g0(x,y,t) 


T-l 

+  E  z(x,y,t) 
t=0 


(5.12) 
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Fur  die  Streuung  der  Zufallsvariablen 

Z  ‘  T'Jo  Z(x’^'t> 

ergibt  si eh 


Sofern  das  Bild  stationer  1st,  ist  die  zeitliche  Glattung  eine  bessere  Methode 
zur  Reduzierung  des  Rauschens  als  die  raumliche  Glattung. 

Die  Auswirkung  der  zeitlichen  Glattung  auf  die  Fokussierungsfunktion  ist  in 
Bild  5.5  demonstriert. 


Kurve  1,  2  und  3  entsprechen  der  SMD  nach  der  zeitlichen  Glattung  von  T  -  4,  8 
und  12.  Burch  die  zeitliche  Glattung  sind  die  Schwingungen  der  Fokussierungs¬ 
funktion  stark  verringert.  Die  Kurve  der  SMD  ist  1m  Vergleich  zur  SMD  des  ori- 
ginalen  Bildes  nicht  verflacht. 
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5.3  Kompensierunq  der  Zoom-Auswirkunct 

Parallel  verlaufende  Linien  scheinen  zusammenzulaufen;  dieses  Phanomen  laBt 
sich  gut  an  Bahngleisen  beobachten.  Stellt  man  sich  vor,  in  Bild  5.6  waren  A 
und  B  Bahnschwel len,  die  parallele  Schienen  trennen  [20], [21]. 


Bild  5.6:  Schematische  Darstellung  der  Zoom-Auswirkung. 

Die  Schwellen  A  und  B  sind  gleich  groB.  Das  Bild  der  entfernteren  Schwelle  A 
ist  kleiner  als  B,  deshalb  miissen  die  Schienen,  die  auf  diesen  Schwellen  lie- 
gen,  bei  A  naher  beieinander  sein  als  bei  B.  Die  parallelen  Eisenbahnschienen 
scheinen  in  beiden  Richtungen  zusammenzulaufen.  Das  ist  die  typische  Zoom-Aus¬ 
wirkung. 

Im  alltaglichen  Leben  haben  wir  alle  schon  solche  Erfahrungen  gemacht  [22]: 
Bewegt  man  sich  durch  eine  Welt  von  stationaren  Objekten,  so  ist  die  auf  der 
Netzhaut  projizierte  visuelle  Welt  scheinbar  vorbeigeflogen.  Tatsachlich 
scheint  die  Welt  fur  eine  bestimmte  Richtung  der  Schubbewegung  und  eine  be- 
stimmte  Blickrichtung  aus  einem  besonderen  Fluchtpunkt,  also  dem  sogenannten 
"Focus  Of  Expansion"  (FOE),  herauszufl ieBen.  Jede  Richtung  der  Bewegung  und 
des  Blickes  verursacht  eine  einzige  FOE.  Fur  die  automatische  Fokussierung  in 
der  vorliegenden  Arbeit  ist  die  Bewegungsrichtung  der  Kamera  senkrecht  zur 
Szene.  Deshalb  befindet  sich  die  FOE  in  der  Mitte  des  Bildes. 

Wenn  die  Kamera  die  relative  Position  des  Objektes  fokussiert,  muB  zuerst  die 
zu  fokussierende  Position  eingegeben  werden.  Solange  sich  diese  Position  nicht 
in  der  FOE,  also  der  Mitte  des  Bildes,  befindet,  wird  sich  das  Bild  von  dieser 
Position  aus  wahrend  des  Fokussierungsprozesses  verandern. 
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Die  Bewegung  der  Kamera  fuhrt  die  Bewegung  im  Bild.  Die  Bewegung  von  einem 
Bild  kann  durch  ein  zweidimensionales  Verschiebungsvektorfeld  beschrieben  wer- 
den.  Jeder  Vektor  dieses  Feldes  verbindet  einander  entsprechende  Objektpunkte. 
Fur  das  Verschiebungsvektorfeld  bzw.  einen  einzelnen  Verschiebungsvektor  wer- 
den  im  folgenden  die  Abkurzungen  VVF  bzw.  VV  benutzt. 

Die  vollstandige  Bestimmung  des  VVF  ist  nur  mdglich,  wenn  die  Bildpunkte  in 
dem  einen  Bild  eindeutigen  Punkten  im  zweiten  Bild  zugeordnet  werden  konnen. 
Wenn  das  Objekt  starr  ist  und  die  Bewegung  von  einem  Bild  durch  die  Bewegung 
der  Kamera  senkrecht  zum  Objekt  verursacht  ist,  ist  die  vollstandige  Bestim¬ 
mung  des  VVF  garantiert.  Das  ist  genau  die  Situation  der  Fokussierung  zur  re- 
lativen  Position  des  Objektes.  In  der  Berechnung  der  Fokussierungsfunktion  der 
relativen  Position  muB  die  Bewegung  des  Bildes,  als  die  sogenannte  Zoom-Aus- 
wirkung  kompensiert  werden.  Weil  das  Objekt  unbeweglich  ist  und  nur  die  Kamera 
sich  wahrend  des  Fokussierungsprozesses  bewegt,  kann  die  Zoom-Auswirkung 
leicht  kompensiert  werden. 

Vor  der  Kompensation  der  Zoom-Auswirkung  muB  das  VVF  uberpriift  werden.  Wie 
sieht  das  VVF  in  der  Bildebene  aus?  Wenn  wir  es  vollstlndig  kennen,  laBt  sich 
damit  eindeutig  auf  die  Bewegungsform  im  dreidimensionalen  Raum  schlieSen. 

Bild  5.7  stellt  fur  das  VVF  eine  quadratische  Flache  dar.  Die  Bewegung  ist  mit 
einem  charakteristischen  VVF  verknupft,  Alle  VV,  die  durch  die  Bewegung  der 
Kamera  senkrecht  zum  Objekt  (weg  vom  Objekt)  verursacht  sind,  sind  auf  die  FOE 
gerichtet. 


Bild  5.7:  Schematische  Darstellung  eines  VVF. 
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Die  FOE  befindet  sich  genau  in  der  Mitte  des  Bildes.  Nachfolgend  werden  die 
Bewegungsvorgange  naher  untersucht,  dabei  wird  nur  die  obenerwahnte  Bewegungs- 
art  betrachtet,  die  Kamera  bewegt  sich  also  senkrecht  zum  Objekt. 


Wahrend  des  Fokussierungsprozesses  ist  die  Bildweite  q  unverandert.  Wenn  die 
Kamera  sich  bewegt,  wird  die  Objektweite  p  standig  verandert.  Die  Objektebene 
(X,Y)  wird  durch  das  optische  System  auf  die  Bildebene  (x,y)  abgebildet.  In 
GauB  scher  Naherung  soil  jedem  Punkt  in  der  Objektebene  das  entsprechende  Bild 
in  der  Bildebene  zugeordnet  sein  (Bild  5.8). 

Der  Ubergang  vom  Objekt-  zum  Bildkoordinatensystem  wird  durch  eine  Koordina- 
tentransformation  beschrieben. 

Wenn  die  Koordinaten  von  der  zu  fokussierenden  Position  in  der  Bildebene 
(x^yj)  sind,  kann  die  entsprechende  Position  in  der  Objektebene  (Xj,Yj)  durch 
die  geometrische  Optik  berechnet  werden.  Es  ist 

r  xi 

xl  =  v-pl  • 


(5.14) 
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Jetzt  1st  die  zu  fokussierende  Position  (X^Yj)  in  der  Objektebene  bestimmt. 
Wahrend  des  Fokussierungsprozesses  verandert  sich  die  Objektweite  p.  Deshalb 
wird  das  Bild  von  (X^Yj)  auch  verandert  und  zwar  wie  folgt: 


Um  die  Koordinaten  (XpYj)  genau  zu  oerecbnen,  muB  die  Objektweite  bekannt 
sein.  fiber  das  1st  unmoglich,  sonst  brauchte  man  das  Objekt  nicht  zu  fokussie- 
ren.  Deshalb  muB  das  Objekt  zuerst  grob  fokussiert  werden.  Durch  die  grobe 
Fokussierung  kann  die  Objektweite  annahernd  bestimmt  werden,  d.h.  die 
Zoom-Auswirkung  kann  annahernd  kompensiert  werden.  Folgend  wird  der  ProzeB  der 
Fokussierung  zur  relativen  Position  zusammengefaBt: 

1}  Das  Objekt  wird  zuerst  grob  fokussiert.  Danach  wird  die  zu  fokussierende 
Position  in  der  Bildebene  ausgewahlt  und  die  Objektweite  pj 

bestimmt. 

2)  Die  zu  entsprechenden  Koordinaten  (XpYj)  werden  nach  (5.14)  be- 

rechnet.  Wahrend  des  ganzen  Fokussierungsprozesses  werden  (XpYj)  festblei- 
ben. 

3)  Die  Kamera  wird  in  der  Nahe  von  Pj  die  beste  Fokussierungsposition  von 

(X  tY  )  suchen.  Vor  der  Berechnung  der  FF  wird  die  Zoom-Auswirkung  kompen¬ 
siert.  Nach  der  Bewegung  der  Kamera  werden  die  zu  (Xj*Yj)  entsprechenden 
Koordinaten  (x,y)  durch  (5.15)  ermittelt.  AnschlieBend  wird  die  FF  mit  den 
Umgebungsbildpunkten  von  (x,y)  berechnet. 
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6.  Fokussierung  von  beweglichen  Objekten 

6_.l  Das  Prinzip  der  Fokussierung  von  beweqlichen  Obiekten 

Die  bisherigen  Betrachtungen  beschaftigen  sich  nur  mit  der  Fokussierung  von 
unbeweglichen  Objekten.  Fur  ein  derartiges  Fokussierungsproblem  spielt  die 
Fokussierungsfunktion  die  entscheidende  Rolle.  Mit  Hilfe  der  sogenannten 
"Hill -Climbing"  Strategie  [23],  [24]  wird  die  Position,  wo  das  Maximum  oder 
Minimum  der  Fokussierungsfunktionen  auftritt,  gesucht.  Es  ist  sehr  wichtig, 
daB  sich  wahrend  des  Fokussierungsprozesses  die  zu  fokussierenden  Objekte 
nicht  bewegen. 

Es  gibt  zwei  Bewegungsarten  vom  Objekt  relativ  zur  Kameral inse,  Erstens  bewegt 
sich  das  Objekt  querab  zur  Kameral inse,  d.h.  der  Abstand  zwischen  der  Kamera- 
linse  und  dem  Objekt  bleibt  naherungsweise  unveranderl ich,  der  von  der  Kamera 
aufgenommene  Objektabschnitt  ist  aber  unterschiedl ich.  Fur  viele  Objekte  ist 
die  Textur  der  Oberflache  von  Ort  zu  Ort  unterschiedl ich.  Wenn  dies  der  Fall 
ist,  ist  die  Fokussierungsfunktion  nicht  mehr  unimudolar.  Tritt  auf  der  ganzen 
Oberflache  des  Objektes  nur  eine  einzige  Textur  auf,  ist  eine  Fokussierung 
eines  solchen  beweglichen  Objektes  mit  Hilfe  der  Fokussierungsfunktion  aller- 
dings  auch  bei  Bewegung  moglich. 

Bei  der  anderen  Bewegungsart  bewegt  sich  das  Objekt  senkrecht  zur  Kameral inse. 
Diese  Bewegungsart  verandert  den  Abstand  zwischen  Kameralinse  und  dem  Objekt. 
Die  Veranderung  dieses  Abstandes  andert  die  Verschiebung  der  besten  Fokussie- 
rungsposition.  Es  ist  klar,  daB  die  Fokussierungsfunktionen  fur  solche  beweg¬ 
lichen  Objekte  ungeeignet  sind. 

In  vielen  Fallen  bewegt  sich  das  Objekt  sowohl  querab  als  auch  senkrecht  zur 
Kameralinse.  Die  Fokussierungsfunktion  ist  in  diesen  Fallen  auch  ungeeignet 
zur  Fokussierung  von  beweglichen  Objekten. 

Es  gibt  heute  viele  Kameras,  die  die  Fahigkeit  zur  automatischen  Fokussierung 
von  beweglichen  Objekten  haben.  Das  Fokussierungsprinzip  einer  solchen  Kamera 
ist  in  zwei  grundlegende  Kategorien  eingeteilt,  namlich  als  aktives  System 
oder  als  passives  System  [25],  [26].  Beide  Systeme  brauchen  ein  zusatzliches 
Gerat.  Bei  der  aktiven  automatischen  Fokussierung  wird  elektromagnetische  oder 
U1 traschal 1 strahl ung  ausgesendet.  Erreicht  diese  Strahlung  das  Ziel,  wird  ein 
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Tell  der  Strahlung  reflektiert.  Die  reflektierte  Strahlung  wird  durch  einen 
angepaBten  Enipf anger  registriert.  GemaB  der  Laufzeit  der  Strahlung  kann  der 
Abstand  zwischen  dem  Gbjekt  und  der  Kamera  bestimmt  werden.  AnschlieBend  ist 
die  Kameralinse  richtig  eingestellt. 

Die  erste  Kamera  Pentax  MEF  mit  passiver  Methode  zur  Realisierung  der  automa- 
tischen  Fokussierung  ist  im  Jahr  1981  entwickelt  worden  [27].  Das  automatische 
Fokussierungs system  von  Pentax  ist  das  sogenannte  EFC  (£lectronic-Focus 
Control)  System.  Statt  der  Untersuchung  der  Fokussierungszustande  in  verschie- 
denen  Fokussierungspositionen  wird  im  EFC-System  nur  das  Erscheinen  des  Bildes 
auf  beiden  Seiten  der  Bildebene  untersucht  (Bild  6.1). 


Objektebene  linse  Bitdebene 

82 

< 

i 


Bild  6.1:  Prinzip  des  passiven  Systems. 

Dazu  werden  zwei  Detektoren  B1,B2  in  gleichem  Abstand  1  von  beiden  Seiten  der 
Bildebene  eingestellt.  Wenn  die  Kamera  sich  in  der  besten  Fokussierungspositi- 
on  befindet,  sind  die  elektrischen  Signale  von  beiden  Detektoren  identisch. 
Wenn  das  Bild  in  der  Bildebene  nicht  im  Fokus  ist,  ist  das  auf  beide  Detekto¬ 
ren  einfallende  Licht  unterschiedlich.  Deshalb  gibt  es  einen  Unterschied  zwi¬ 
schen  beiden  elektrischen  Signalen.  Durch  diesen  Unterschied  kann  die  Kamera 
wieder  die  Szene  fokussieren.  Das  Vorzeichen  dieses  Unterschieds  bestimmt  die 
Richtung  der  Linsenbewegung.  Solange  dieses  Vorzeichen  sich  nicht  verandert* 
wird  die  Linse  in  einer  Richtung  weiter  verschoben,  bis  der  Unterschied  ver- 
schwindet. 

In  der  vorliegenden  Arbeit  wird  das  Prinzip  der  Fokussierung  eines  beweglichen 
Objektes  anders  als  bei  der  oben  erwahnten  Methode  gewahlt.  Im  System  wird  ein 
zusatzliches  Lasergerat  benutzt,  aber  ohne  Empfanger  zur  Registrierung  der 
reflektierten  Laserstrahlung.  Die  Laserstrahlung  zeigt  hohe  zeitliche  Koharenz 
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(lange  zusammenhangende  Wei lenzuge)  urtd  hohe  raumliche  Koharenz.  Sie  ist  eine 
typisch  punktformige  Lichtquelle. 

Wegen  der  hohen  raumlichen  Koharenz  ist  die  Laserstrahlung  auf  einem  kleinen 
Gebiet  des  Objektes  konzentriert.  Die  Beleuchtungsstarke  von  diesem  Gebiet  ist 
viel  hoher  als  die  des  ubrigen  Gebietes  vom  Objekt.  Deshalb  sind  die  Grauwerte 
in  diesem  Gebiet  erheblich  groBer  als  die  von  anderen  Bildpunkten.  Mi t  Hilfe 
dieser  Tatsache  ist  es  leicht,  die  Koordinaten  des  Bildes  vom  Laserfleck  zu 
ermitteln. 

Die  Laserstrahlung  ist  in  einem  bestimmten  Winkel  zur  optischen  Achse  der  Ka- 
mera  ausgerichtet.  Damit  kann  der  Laserfleck  in  verschiedenen  Positionen  an 
der  Oberflache  des  Objektes  einfallen,  wenn  sich  die  Position  des  Objektes 
verandert.  Wenn  die  anderen  Parameter  der  Kamera  festbleiben,  kann  der  Abstand 
zwischen  der  Kamera  und  dem  Objekt  mit  Hilfe  der  Bildkoordinaten  des  Laser- 
flecks  direkt  berechnet  werden. 

Im  System  wird  ein  HeNe-Lasergerat  benutzt.  Die  Wellenlange  dieses  Lasergera- 
tes  ist  632,8  nm.  Deshalb  ist  die  Laserstrahlung  rot.  Unter  bestimmter  Bedin- 
gungen,  namlich  daG  die  Parameter  der  Kamera  unverandert  bleiben,  konnen  uber 
die  Koordinaten  des  Laserflecks  im  Bild  der  Abstand  zwischen  der  Kameralinse 
und  dem  Objekt  vollstandig  bestimmt  werden.  Bild  6.2  zeigt  die  Bilder  des 
durch  eine  Laserstrahlung  gerichteten  Objektes  in  verschiedenen  Objektweiten. 

In  Bild  6.2a  sind  die  analogen  Signale  des  Bildes  vor  der  Digital isierung 
nicht  vorverarbeitet.  Die  Grauwerte  des  Laserflecks  sind  nicht  so  deutlich  von 
der  Umgebung  getrennt.  Urn  die  Grauwerte  des  Laserflecks  problemlos  von  der 
Umgebung  zu  unterscheiden,  muB  das  analoge  Signal  der  CCD-Kamera  vor  der  Digi¬ 
tal  isierung  behandelt  werden.  Die  folgende  Gleichung  stellt  die  Beziehung  zwi¬ 
schen  der  eingegebenen  Spannung  v(x,y)  eines  Bildpunktes  und  dem  entsprechen- 
den  Grauwert  f(x,y)  dar: 


f{x,y)  =  v(x,y) • fGain* 256+4, 25- i Level 


(6.1) 


a)  p=500mm 


p)  p= 450mm 


* 


c)  p= 400mm 


d)  p- 350mm 


Blld  6.2:  Bilder  mit  Laserfleck. 

fGain  ist  der  Verstarkungsfaktor  der  Analogschaltung,  die  das  Videosignal  vor 
der  Digital! si erung  vorverarbeitet;  iLevel  kontrolliert  die  Abweichung  der 
Analogschaltung.  Wenn  man  die  Werte  von  fGain  und  iLevel  richtig  wahlt,  kann 
die  FI  ache  der  Laserstrahlung  In  Bild  von  der  ubrigen  Flache  total  getrennt 
werden. 

Durch  Experimente  sind  fGain  und  iLevel  als  1,995  (also  4  dB}  und  -150  ermit- 
telt  worden.  Bild  6.2b,c,  und  d  zeigen  die  durch  Gleichung  (6,1)  vorverarbei- 
teten  Bilder.  In  solchen  Bildern  sind  die  Grauwerte  des  Laserflecks  255,  Die 
ubrige  Flache  im  Bild  ist  ganz  schwarz  mit  Grauwert  0. 

In  der  Praxis  ist  das  Bild  des  Laserflecks  nicht  ein  Punktbild,  sondern  eine 
unregel maBige  Form.  Das  macht  die  Entscheidung  so  schwierig,  welcher  Bildpunkt 
die  Koordinaten  des  Laserflecks  im  Bild  reprasentiert.  Zur  Vereinfachung  wird 
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der  Massenmittelpunkt  des  Laserflecks  als  Koordinaten  des  Laserflecks  benutzt, 
also 


F  ist  die  Zahl  der  Bildpunkte  in  der  Flache  vom  Laserfleck  im  Bild.  2  und  2 
lassen  sich  durch  folgene  Gleichung  *  * 


f  511  511 
2=22  f  (x,y) 
x=0  y=0  x 

511  511 

V  2  2  f  (x,y) 

y  x=0  y=0  y 


berechnen,  mit 


(6.3) 


fx(x,y) 


x  wenn  f(x,y)  =  255 
0  sonst 


und 


y  wenn  f{x,y)  =  255 

f„(x,y)  = 

3  [0  sonst 

Die  Flache  des  Laserflecks  F  andert  sich,  wenn  die  Kameraposition  p#  verandert 
wird.  Wenn  das  Bild  genau  im  Fokus  ist,  erreicht  F  das  Minimum.  Wenn  die  Karne- 
ra  von  der  besten  Fokussierungsposition  entfernt  ist,  nimmt  F  standig  zu.  Wie 
Bild  6.3  zeigt,  ist  F  eine  unimodulare  Funktion  der  Kamerapositon  p\ 
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Bild  6,3:  Veranderung  der  FI  ache  F. 

6,2  Beziehuna  zwischen  der  Obiektweite  und  den  Bildkoordinaten  des  La serf leeks 

Um  die  Beziehung  zwischen  der  Objektweite  p  und  den  Koordinaten  des  Laser- 
flecks  herzuleiten*  warden  zuerst  die  Koordinatensysteme  festgelegt,  Zur  Be- 
schreibung  der  Lage  der  Objekte  gibt  es  zwei  Moglichkeiten  {Bild  6.4).  Zum 
einen  kann  sie  in  einem  Koordinatensystem  angegeben  werden,  das  auf  die  be- 
trachtete  Szene  bezogen  ist}  das  sogenannte  Welt  koordinaten  system  (X%¥',Z#). 

Ein  zweites  Koordinatensystem  ist  mit  der  sich  bewegenden  Kamera  (Kamerakoor- 
dinatensystem  (XSY,Z))  verknupft.  Physikern  sind  solche  Bewegungsbetrachtungen 
in  verschiedenen  Koordinatensystemen,  z.B.  als  ruhender  und  mitbewegter  Beob- 
achter,  aus  der  elementaren  Mechanik  her  vertraut.  In  der  Bildverarbeitung 


Bild  6.4:  Welt-  und  Kamerakoordinatensysteme. 
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steht  anstelle  des  Beobachters  eine  Kamera.  Es  1st  allgemeine  Konvention,  die 
X-  und  Y-Achse  in  die  Bildebene  der  Kamera  zu  legen,  wahrend  die  Z-Achse  mit 
der  optischen  Achse  des  Kamerasystems  identisch  ist. 

Normal erweise  sind  die  beiden  Koordinatensysteme  nicht  koinzidiert.  Durch  Ro¬ 
tation  urn  den  Ursprung  und  eine  Translation  mit  dem  Translationsvektor  I  kann 
das  Weltkoordinatensystem  in  das  Kamerakoordinatensystem  ubergefiihrt  werden. 


In  der  vorgelegten  Arbeit  ist  das  Weltkoordinatensystem  fest.  Wahrend  des  Fo- 
kussierungsprozesses  bewegt  sich  das  Kamerasystem.  Deswegen  hat  das  Kamerako¬ 
ordinatensystem  eine  relative  Bewegung  zum  Weltkoordinatensystem.  Normalerwei- 
se  weiB  man  zuerst  die  Weltkoordinaten  des  Objektes.  Der  Ubergang  von  den 
Welt-  zu  den  Kamerakoordinaten  wird  durch  eine  Koordinatentransformation  be- 
schrieben.  Diese  laBt  sich  in  zwei  elementare  Transformationen  aufteilen:  Zu¬ 
erst  wird  das  Kamerakoordinatensystem  so  gedreht,  daB  es  genauso  ausgerichtet 
ist,  wie  das  Weltkoordinatensystem.  Daran  anschlieBend  folgt  eine  Translation 
des  Koordinatensystems  urn  einen  Translationsvektor  I.  Die  Trans! ationstrans- 
formation  wird  durch  folgende  Forme!  zusammengefaBt: 


X  -  X'  +  Tx  , 

Y  =  Y'  +  Ty  »  (6.4) 

Z  =  V  +  t2  . 

Gleichung  (6.4)  kann  als  folgende  Matrixform  umgeschrieben  werden: 


(6.5) 
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Die  Hintereinanderschaltung  mehrerer  Transformationen  1st  manchmal  niitzlicher 
als  eine  einzige  Kombinationstransformation.  Die  mathematische  Darstellung 
dieses  Prozesses  kann  einfach  durch  eine  quadratische  Matrix  realisiert  wer- 
den.  So  kann  (6.5)  in  folgende  Gleichung  umgeschrieben  werden: 


(6-6) 


Durch  die  o.g.  Umschreibung  konnen  alle  Transformationen  als  eine  vereinigte 
Matrix  reprasentiert  werden 


V  =  A*r 


(6.7) 


wobei  A  eine  4x4  Transformationsmatrix  ist  und 


X' 

*r 

Y 

,  r  = 

V 

Z 

V 

1. 

.1  . 

Fur  die  Translation  ist  die  Transformationsmatrix  durch  folgende  Form  darge- 
stellt: 


0  Tx 


0  1  J 

Die  Rotation  im  dreidimensionalen  Raum  wird  durch  eine  orthogonale  Matrix  er- 
zeugt.  Eine  allgemeine  Transformation  in  ein  Koordinatensystem  beliebiger 
Orientierung  kann  durch  drei  hintereinander  ausgefuhrte  Drehungen  urn  verschie- 
dene  Koordinatenachsen  zusammengesetzt  werden.  Die  Gesamtdrehung  kann  man  sich 
als  Teildrehung  um  die  X-Achse  <-  S).  urn  die  Y-Achse  (=  ?)  und  urn  die  Z-Achse 
(=  8}  zusammengesetzt  denken. 
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Die  Transformationsmatrix  fur  die  Drehung  um  die  X-Achse  R~  ist 

a 


0 

COStt 

-sintt 

0 


0  O' 

sina  0 
cost*  0 
0  1 


Der  Rotationswinkel  X  ist  im  Uhrzeigersinn  gemessen.  Diese  Transfomation 
beeinfluBt  nur  die  Werte  der  X-  und  Y-Koordinaten. 


Die  Teildrehung  um  die  Y-Achse  und  um  die  Z-Achse  lassen  sich  durch  die  Trans- 
formationsmatrizen  R^  und  Rg  beschreiben: 


’  cos# 

0 

sin# 

O' 

cos8 

sinS 

0 

0 

0 

1 

0 

0 

Riv  = 

-sinS 

cos8 

0 

0 

-sin# 

0 

cos# 

0 

*  -8 

0 

0 

1 

0 

0 

0 

0 

1. 

0 

0 

0 

1 

Die  gesamte  Transformation  kann  in  die  vier  Teiltransformationen  Ay,  Eg 
und  Rg  zerlegt  werden.  Die  gesamte  Transformationsmatrix  ist  durch  das  Produkt 
der  Teiltransformationsmatrizen  dargestellt. 

Durch  die  Transformationen  kann  man  die  Kamerakoordinaten  (X,Y,Z)  eines  Punk- 
tes  in  die  Szene  bekommen.  Die  Beziehung  zwischen  den  Kamerakoordinaten 
(X,Y,Z)  und  den  Bildkoordinaten  (x,y,z)  ist  durch  eine  perspektivische  Trans¬ 
formation  beschrieben.  Eine  perspektivische  Transformation  projiziert  die 
dreidimensionalen  Punkte  in  eine  Bildebene.  Die  perspektivische  Transformation 
spielt  eine  zentrale  Rolle  bei  der  Bildverarbeitung,  weil  sie  eine  Approxima¬ 
tion  zur  Abbildung  einer  dreidimensionalen  Welt  in  ein  Bild  ermoglicht. 

Als  einfachstes  Kameramodell  wird  eine  Lochkamera  gewahlt,  deren  Abbildungs- 
geometrie  in  Bild  6.5  dargestellt  ist. 
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Bild  6.5:  Zentral pro jekt i on  bei  der  Abbildung  mit  einer  Lochkamera. 

Wie  Bild  6.5  zeigt,  ist  das  Zentrum  des  Elides  der  Ursprung  des  Bildkoordina- 
tensystems  und  das  Linsenzentrum  hat  die  Koordinaten  (0,0,q).  Das  Kamerakoor- 
dinatensystem  (X,Y*Z)  und  Bildkoordinatensystem  (x,y,z)  sind  ubereinanderl le¬ 
gend. 

GemaB  der  geometrischen  Optik  gehen  alle  Verbindungsl inien  (Lichtstrahlen) 
zwischen  der  Objektebene,  die  mit  den  Kamerakoordinaten  (X,Y,Z)  beschrieben 
wifd,  und  der  Bildebene  mit  den  Bildkoordinaten  (x,y,z)  durch  das  Linsenzen¬ 
trum.  Daher  konnen  wir  den  Strahlensatz  der  Zentral pro jekt ion  anwenden,  um 
eine  Beziehung  zwischen  den  Karoera-  und  den  Bildkoordinaten  zu  erhalten. 


y  _  Jf _ 3L 

[q  Z-q  q-Z 

Die  negativen  Vorzeichen  vor  X  und  Y  bedeuten,  daB  die  Bildpunkte  tatsachlich 
umgekehrt  sind.  Die  Bildkoordinaten  des  projizierten  3D-Punktes  folgen  direkt 
aus  (6.8): 


x 


y 


ail 

q-Z 


(6.9) 
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Es  ist  sehr  wichtig  zu  bemerken,  daR  diese  Gleichung  nichtlinear  ist,  weil  sie 
eine  Division  durch  die  Variable  Z  enthalt.  Mit  Hilfe  einer  einzigen  Matrix 
konnen  Translation,  Rotation  und  Projektion  als  eine  verallgemeinerte  Trans¬ 
formation  beschreiben  werden.  Zu  diesem  Zweck  werden  die  homogenen  Koordinaten 
benutzt. 

Die  homogenen  Koordinaten  eines  Punktes  mit  den  kartesischen  Koordinaten 
(X , Y , Z)  sind  definiert  als  (k*X,k*Y,k*Z,k),  wobei  k  eine  will kurl iche,  von 
Null  verschiedene  Konstante  ist.  Die  Umwandlung  der  homogenen  Koordinaten  zu- 
riick  zu  kartesischen  Koordinaten  erhalt  man  durch  die  Teilung  der  ersten  drei 
homogenen  Koordinaten  durch  die  vierte.  Ein  Punkt  im  kartesischen  Koordinaten- 
system  V  kann  durch  den  Vektor  im  homogenen  System  dargestellt  werden: 


Die  Transformationsmatrix  der  perspektivischen  Transformation  laGt  sich  defi- 
nieren  zu: 


[0  0  -1/q  Oj 

Dann  liefert  das  Produkt  E-Vh  einen  neuen  Vektor,  namlich 


£h  -  *.vh  - 


k-X  ' 

k-Y 

k-Z 

-k-Z/q+k 


Die  Komponenten  von  sind  die  Bildkoordinaten  in  homogener  Form.  Die  karte¬ 
sischen  Koordinaten  von  irgendeinem  Punkt  in  dem  Kamerakoordinatensystem  sind 
in  Vektorform 
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Die  ersten  beiden  Komponenten  von  C  sind  die  (x,y)-Koordinaten  in  der  Bildebe- 
ne  von  einem  3D-Punkt  (X,¥,Z).  Die  dritte  Komponente  z  ist  nicht  interessant 
fiir  die  Bildverabeitung,  wenn  man  das  Kameramodell  aus  Bi Id  6,4  benutzt,  Diese 
Komponente  funktioniert  als  eine  freie  Variable  in  der  invers  perspektiviscben 
Transformation, 

Die  invers  perspektivische  Transformation  bildet  einen  Bildpunkt  zur  3D-Ob- 
jektebene  zuruck.  Aus  Gleichung  (6.12)  ergibt  sich 

h  -  £_1-£h  •  (6’14) 

Normal erweise  sind  die  Koordinaten  vom  Bildpunkt  durch  (x,y,0)  dargestellt; 
z=0  bedeutet,  daB  die  Bildebene  sich  in  der  Position  z  =  0  befindet.  Dieser 
Punkt  kann  in  homogener  Form  in  durch 


C  =  k'y 
£h  0 


(6.15) 


reprasentiert  werden. 

Setzt  man  in  Gleichung  (6.14)  ein,  so  folgt 


V  -  k*^ 

0 


(6.16) 


Oder,  in  kartesischen  Koordinaten, 


v  -  Y  -  hr 


(6.17) 


Dieses  Ergebnis  ist  nicht  erwartet,  weil  es  Z  =  0  fOr  alle  3D-Punkte  liefert. 
Der  Grund  hierfur  ist  der  folgende;  Die  Abbildung  einer  3D-Szene  zu  der  Bild¬ 
ebene  ist  eine  "viel-zu-eins"  Transformation.  Der  Bildpunkt  (x,y)  entspricht 
einer  Gruppe  der  koll inear  dreidimensionalen  Punkte,  die  sich  auf  einer  Gera- 
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den  befinden.  Diese  Gerade  geht  durch  (x,y,0)  und  (0,0,q).  Die  Gleichung  die- 
ser  Geraden  im  Kamerakoordinatensystem  ist: 

*  -  |(q-Z)  • 

V  -  |«.-Z)  .  <6-!8> 

Diese  Gleichung  zeigt:  Nur  wenn  man  etwas  uber  die  3D-Punkte  weiB,  z.B.  die 
Z-Koordinaten,  kann  man  diesen  3D-Punkt  aus  seinen  Bildkoordinaten  vollstandig 
zuruckgewinnen.  Urn  dieses  Problem  zu  vermeiden,  wird  die  z  Komponente  von  £h 
nicht  als  Null,  sondern  als  eine  freie  Variable  behandelt,  also  " 


Aus  Gleichung  (6.14)  folgt  dann 

‘  k-x  ' 
v  -  k-y 

h-  k.2  •  (6.20) 

k-z/q+k 

Die  kartesischen  Koordinaten  von  V  sind 
'X  =  q-x/(q+z)  , 

Y  =  q-y/ (q+z)  ,  (6>21) 

Z  =  q*z/(q+z) 

Aus  der  dritten  Gleichung  von  (6.21)  wird  z  herausgelost.  Man  erhalt 


Setzt  man  z  in  die  ersten  zwei  Gleichungen  von  (6.21)  ein,  ergibt  sich  sofort 
die  Gleichung  (6.18).  Diese  Gleichung  bedeutet,  daB  die  Wiederherstellung  ei- 
nes  dreidimensionalen  Punktes  aus  seinen  Bildkoordinaten  durch  die  invers  per 
spektivische  Transformation  die  Kenntniss  uber  wenigstens  eine  der  drei  Kame- 
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rakoordinaten  erfordert.  Im  beschriebenen  System  1st  das  Kamerakoordinatensy- 
stem  vor  dem  FokussierungsprozeB  mit  dem  Wei  tkoordinatensystem  koinzidiert, 
Wahrend  des  Fokussierungsprozesses  wird  sich  das  Kamerakoordinatensystem  nur 
Tangs  der  Z'-Achse  des  Wei tkoordinaten systems  bewegen.  Es  gibt  keine  Rotation 
zwischen  beiden  Koordinatensystemen,  Deshalb  ist  die  gesamte  Trans! ations- 
matrix  durch 

10  0  O' 

0  10  0 

T  0  0  1  -Tz 

0  0  0  1 

dargestellt,  Setzt  man  A-j-  in  (6,7)  ein,  so  folgt 


(6.22) 


Nach  der  obigen  Vorbereitung  kann  man  jetzt  die  Beziehung  zwischen  den  Bildko- 
ordinaten  des  Laserflecks  und  der  Objektweite  her! ei ten,  Zur  Vereinfachung 
wird  das  Lasergerat  so  eingestellt,  daB  die  Laserstrahlung  parallel  zur 
X#Z#-Ebene  des  Weltkoordinatensystems  ist,  Deshalb  verandert  die  Verschiebung 
des  Objektes  nur  die  V-  und  X'-Koordinaten  der  Laserstrahlung,  Y'  bleibt  un- 
veranderlich. 


Bild  6,6;  Geometrie  der  dreidimensionalen  Koordinaten  vom  Laserfleck. 
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(6.27) 


Aus  (6.27)  wird  ersichtlich,  wenn  (q-x-tg?)  nicht  identisch  Null  ist,  kann 
iiber  die  Bildkoordinate  x  die  Kamerakoordinate  Z  des  Laserflecks  eindeutig 
bestimmen  werden.  (q-x* tg-y)  =  0  bedeutet,  daB  die  Laserstrahlung  durch  das 
Linsenzentrum  lauft.  Das  ist  aber  unmoglich.  Wenn  die  Kamerakoordinate  Z  be- 
kannt  ist,  kann  die  Kamera  direkt  zur  besten  Fokussierungsposition  fahren. 
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Die  Besonderheit  dieses  Fokussierungsalgorithmus  liegt  darin,  daB  der  Abstand 
zwischen  der  Linse  und  dem  Objekt  roit  Hilfe  der  Laserstrahlung  direkt  berech- 
net  werden  kann.  Die  Grauwerte  des  Slides  spielt  dabei  keine  Rolle.  Der  ProzeB 
der  Fokussierung  eines  beweglichen  Objektes  kann  in  folgende  Schritte 
eingeteilt  werden: 

1.  Schritt:  Der  Computer  wird  die  Kamerakoordinate  Z  des  zu  fokussierenden 

Objektes  mit  Hilfe  der  Bildkoordinate  x  des  Laserflecks  be- 
rechnen.  Die  Objektweite  p  ist  dann  Z-q. 

2.  Schritt:  GemaG  der  Objektweite  p  beurteilt  der  Computer,  ob  die  Kamera 

sich  in  der  besten  Fokussierungsposition  befindet. 

3.  Schritt:  Die  Kamera  fahrt  zur  besten  Fokussierungsposition. 

tfahrend  des  Fokussierungsprozesses  werden  die  obigen  drei  Schritte  wiederholt, 
damit  das  bewegliche  Objekt  ununterbrochen  fokussiert  werden  kann. 

6.3  Kamerakalibrierung  und  Fehleranalyse 

Die  Kamerakalibrierung  ist  ein  wichtiger  Vorgang  fur  die  Anwendungen  der  Bild- 
verarbeitung.  Tsai  [28]  hat  einen  umfassenden  Uberblick  uber  die  Kamerakali¬ 
brierung  gegeben.  Die  vorhandene  Technik  der  Kamerakalibrierung  ist  in  zwei 
Kategorien  eingeteilt:  das  tochkameramodel 1  (lineares  Lochkameramodell  [29], 
[30]  und  nichtlineares  Lochkameramodell  [31],  [32]}  und  das  Zweiebenenmodell 
[33].  In  der  vorliegenden  Arbeit  wird  das  lineare  Lochkameramodell  benutzt. 

Die  Gleichungen  (6.14)  und  {6.15}  charakterisieren  die  Abbildung  eines  Bildes 
durch  die  Projektion  der  3D-Punkte  in  die  Bildebene.  Diese  beiden  Gleichungen 
bilden  die  Basis  fur  das  mathematische  Model!  einer  Kamera.  Dieses  Model!  ba- 
siert  auf  der  Annahme,  daS  die  Kamera-  und  Weltkoordiantensysteme  ubereinan- 
derliegen.  In  vielen  Situationen  sind  beide  Koordinatensysteme  allerdings  ge- 
trennt.  Aber  durch  eine  Rotation  urn  den  Ursprung  und  eine  Translation  mit  dem 
Trans! at ionsvektor  I  kann  das  Kamerakoordinatensystem  in  das  Weltkoordinaten- 
system  ubergefiihrt  werden.  tlm  die  gesamte  Translationsmatrix  zu  bekommen,  muB 
man  die  Kenntnisse  uber  die  Bildweite  q,  den  Trans! ationsvektor  I  und  die  drei 
Drehwinkel  a*  8  genau  kennen. 


-  119  - 


-  120  - 


Der  KalibrierungsprozeB  besteht  nun  aus: 

a)  Es  warden  wenigstens  m  =  6  Punkte  mit  den  Koordinaten  (Xj,Yi,Zj)* 
i  «  I,  2f  ...»  m  im  Weltkoordinatensystem  gemessen, 

b)  Die  entsprechenden  Bildkoordinaten  (x^,y.),  i  *>  1,  2,  m  werden  mit 
Hilfe  der  Kamera  in  einer  bestimmten  Position  bestimmt. 


c)  Setzt  mart  diese  Koordinaten  in  Gleichung  (6.31)  ein,  so  erhalt  man  2m 
Gleichungen  mit  12  unbekannten  Koeffizienten, 

d)  Lost  man  dieses  Gleichungssystem  auf,  erhalt  man  die  12  unbekannten 
Koeffizienten. 

Es  gibt  viele  numerische  Algorithmen  2ur  Suche  einer  optimal en  Losung  fur  ein 
lineares  Gleichungssystem.  Ein  Beispiel  hierfiir  ist  die  Arbeit  von  Noble  [34], 

tfenn  die  Welt-  und  Kamerakoordinatensysteme  ubereineinderliegen,  vereinfacht 
sich  die  Gleichung  (6.31)  zu 


r+  -  x  =  0  , 
Y'+  |*y*Zf  -  y  «  0  . 


(6.32) 


Das  Gleichungssystem  (6.32)  besteht  aus  zwei  Gleichungen  mit  nur  einem  unbe¬ 
kannten  Koeffizienten  q.  Deshalb  braucht  man  nur  eine  Weltkoordinate 
(X%Y%Z'}  und  die  entsprechende  Bildkoordinate  (x,y).  Aus  (6.32)  erhalt  man 
und  q2 


«Z' 
>1  =  x-X? 

,  =£lZ' 
l2  y-Y' 


Bei  Anwendung  des  "Least-Squared  Error”  Verfahrens  kann  ein  optimales  q 
erzielt  werden,  Es  lautet 


dl+q2 

q  -  -r- 


2x*y-x*Y'-y<Xf 


V 


(6.33) 
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Aulier  der  Bildweite  q  sind  noch  zwei  andere  Koeffizienten  y  und  £  im  System 

festzulegen.  Von  (6.27)  kann  man  sehen,  urn  y  und  £  zu  bestfmmen,  miissen  die 
Kamerakoordinaten  von  zwei  Punkten  (Xj.Vj.Zj),  (X2,V.,Z  )  und  die 
entsprechenden  Bildkoordinaten  (x,,y,),  (x2,y2)  bekannt  sein.  Setzt  man  diese 
Koordinaten  in  (6.27)  ein,  so  ergibt  sich 


=  q- (t-Xj )  -  tg^-q*  Tz  , 
Z2- (q-x2* tg-y)  »  q- (£-x2).tg7-q-T  . 


Lost  man  dieses  Gleichungssystem  auf,  erhalt  man  7  und  £ 


T  =  tg 


-i  q-tw 

Q' (xo-x,)-(x0-Z0-x 


2_x1 J- tx2-Z2-Xj -Zj J  ’ 


r  .  1-)i2-V<l-»3-Txtx1-ZrTz-q.x1.Z,+x1-Z1-Z,-x?-Z1-Z.-q-x1-Tz-x.-Z1.T7 

I  pTz,-z2) - - - L-L—  ■ 

(6.35) 

Wenn  die  Welt-  und  Kamerakoordinatensysteme  iibereinanderl iegen,  ist  Tz  =  0. 
Dann  vereinfacht  sich  (6.35)  zu 


7  -  tg 


-i  q^zi-z2) 

q* (x2~x j )-(x2*Z2-Xj -Zj) 


q-x2-Z1-q.x1-Z2.xrZrZ?-x?.Z1.Z? 

q-(zrz2)  - —  ’ 


Urn  die  drei  Koeffizienten  q,  7  und  C  zu  bekommen,  sind  zwei  Kamerakoordinaten 
und  die  entsprechenden  Bildkoordinaten  erforderl ich,  also  bei spiel sweise 

X,]  [-12,89]  fXJ  [8,85]  f  . 

V,  -  1,34  ,  V  .  1,35  ,  X1  .  M  .  (-M151 

zj  590  l\  455  W  l'°'I74J  ’  N  "  l'0’224  ' 
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Setzt  man  diese  Koordinaten  in  (6,33)  und  (6,36)  ein,  so  folgt 

q  =  67,86  rrm  ;  *r  “  SI" 52'  *,  £  -  71,53  mm. 

Die  durch  (6.27)  gewonnene  Z-Koordinate  1st  abhangig  von  den  Koeffizienten  q, 
7,  t,  Tz  und  x.  Jeder  Fehler  in  diesen  Grofien  wird  Fehler  von  Z  verursachen. 
Ole  GroBen  q,  ?,  £  werden  vor  dem  FokussierungsprozeB  bestimmt  und  wahrend  des 
Prozesses  nicht  verindert.  Die  x-Koordinate  wird  durch  viele  Faktoren  beein- 
fluBt  und  wahrend  des  Prozesses  laufend  gemessen.  Der  Fehler  von  x  1st  sehr 
schwer  zu  kontrollieren.  Tabelle  6.1  zeigt  die  realen  und  die  durch  (6.27) 
berechneten  Werte  von  Z. 


Nr. 

ZK  (mm) 

Zu(imn) 

Relaliver 
Fehler  (%) 

1 

380 

381,7 

0,45 

2 

390 

391. B 

0.45 

3 

400 

398,2 

0,45 

4 

410 

408,4 

0,40 

5 

420 

418,3 

0,41 

e 

430 

427,4 

0,80 

7 

440 

437,3 

0,61 

8 

450 

452,7 

0,60 

9 

460 

462,4 

0,52 

10 

470 

471,8 

0.40 

11 

480 

482,5 

0,52 

12 

490 

492,2 

0.45 

13 

500 

502,4 

0,48 

Tah.  6JU  Fehler  von  Z, 

Gemafi  der  Fehlerfortpflanzung  kann  der  absolute  Fehler  SI  von  Z  aus  Gleichung 
(6.27)  hergeleitet  werden: 


(6.37) 
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Aus  (6.27)  folgt  dabei : 


Die  Bewegung  der  (Camera  verandert  den  Wert  von  Tz.  Weil  die  Bewegung  der  (Came¬ 
ra  durch  einen  Schrittmotor  realisiert  1st,  kann  die  Position  der  Kamera  genau 

bestimmt  werden,  also  kann  fiTz  vernachlassigt  werden.  Die  Fehler  57,  fit  und  5q 
kann  man  im  ProzeB  der  Kamerakal ibrierung  kontroll ieren.  Der  Fehler  fix  ist 
deshalb  die  Hauptursache  fur  den  Fehler  fiZ. 
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7.  Entwurf  eines  Fokussierungsregelkreises 
7.1  Max  Vision  AT-1  Bildverarbeitunossystem 

Fur  die  Entwicklung  der  automat ischen  Fokussierung  der  Kamera  wurde  das  Bild- 
verarbeitungssystem  Max  Vision  AT-1  der  Firma  DATACUBE  eingesetzt.  Im  Max  Vi¬ 
sion  System  steht  eine  Reihe  von  Geraten  zur  Verfugung.  Bild  7.1  1st  eine 
schematische  Darstellung  des  Systems. 


Bild  7.1:  Blockschaltbild  der  Hardware-Konfiguration  des  Bildverarbeitungs- 
systems . 

1)  Der  Host  Computer 

Oer  Host  Computer  (ESCGM  386/33)  ist  ein  Personal  Computer,  der  mit  dem  Compu¬ 
ter  IBM  AT  kompatibel  ist.  Der  Host  Computer  dient  zur  Durehfuhrung  der  Bild- 
verarbeitungsprogramme  und  zur  Steuerung  aller  Peripherien.  Das  Betriebssystem 
von  ihm  ist  MS-DOS. 

2)  Das  Max  Vision  AT-1  System 

Das  Max  Vision  System  ist  ein  Gerat,  das  die  komplizierten  Aufgaben  der  Bild- 
verarbeitung  einfach  losen  kann.  Die  kraftige  Hardware  und  extensive  Software- 
Bib!  iothek  vom  Max  Vision  System  macht  es  geeignet  zur  Unterstiitzung  ver- 
schiedener  Anwendungen. 

Das  Max  Vision  System  arbeitet  in  Verbindung  mit  dem  Host  Computer  und  hat 
einen  sogenannten  "Pipelined  Digital  Processor"  (POP)  mit  sehr  schneller  Ge- 
schwindigkeit.  Der  PDP  ist  ein  digitaler  Matrixprozessor,  der  aus  einem  Multi¬ 
plier,  zwei  took-Up-Tabellen  fur  Operanden,  einer  Arithmetik-Logikeinheit 
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(ALU)  mit  zwei  16-Bit  Operanden  und  einer  Clipper-  und  Shifterschaltung  fur 
die  Datennormal isierung  besteht.  Zur  Ein-  und  Ausgabe  des  Bildes  werden  1m  Max 
Vision  System  ein  A/D  und  ein  D/A  Converter  verwendet.  Bis  zu  4  Videokameras 
konnen  mit  dem  Max  Vision  System  verbunden  werden.  AuBerdem  kann  das  System 
gleichzeitig  3  Bilder  in  inneren  Bildspeicher  speichern. 

Der  PDP  kann  folgende  Operationen  durchfiihren:  Transformation  der  Daten  zwi- 
schen  zwei  Look-Up-Tabellen,  Multiplikationsoperationen,  Logikoperationen, 
Arithmetikoperationen,  Datennormal isierung  fur  alle  262144  (512x512)  Bildpunk- 
te  in  Echtzeit  (innerhalb  1/30  Sekunde). 

3)  CCD-Kamera 

Die  Quelle  des  Videosignals  kommt  aus  einer  selbst  aufgebauten  CCD-Kamera. 
Diese  CCD-Kamera  erzeugt  das  CCIR  50  Hz  standardisierte  analoge  Videosignal. 
Der  Kern  der  CCD-Kamera  ist  ein  monochromatischer  Abbildungsmodul  NCA1 101/01 
der  Firma  Philips.  Die  Bildflache  des  Abbildungsmodul s  ist  6,00  mm 
(horizontal)  X  4,5  mm  (vertikal).  Die  Zahl  der  Bildpunkte  betragt  604  x  588. 
Das  Max  Vision  System  benutzt  davon  nur  512  x  512  Bildpunkte.  Die  GroBe  jedes 
Bildpunktes  ist  deshalb  ungefahr  0,01  mm  x  0,00773  mm. 

4)  Die  Monitore 

Es  gibt  zwei  Monitore  im  System.  Ein  Farbmonitor  dient  als  Ausgabeeinheit  vom 
Bild.  Er  kann  gleichzeitig  drei  (rot,  grun,  blau)  analoge  Videosignale  iiber- 
nehmen.  Der  andere  Monitor  arbeitet  als  Kontrollbildschirm  fur  den  Host  Compu¬ 
ter. 

5)  Die  "ISERT"  Interfacekarte  4.0 

Die  "ISERT"  Interfacekarte  4.0  ist  ein  Schrittmotorantrieb,  der  in  den  letzten 
Jahren  im  Bereich  der  Positionierungssteuerung  und  Koordinatenantriebe  immer 
mehr  an  Bedeutung  gewonnen  hat.  Der  Schrittmotor  wandelt  elektrische  Impulse 
aus  der  Interfacekarte  in  eine  mechanische  Drehbewegung  mit  definiertem 
Schrittwinkel  urn.  Jedes  Steuersignal  aus  der  Interfacekarte  4.0  erzeugt  einen 
Schritt  fur  den  Schrittmotor. 

Die  Interfacekarte  4.0  ist  ein  mikroprozessorgestiitztes  Steuerungssystem  fur 
Schrittmotoransteuerungen.  Die  charakteristische  Eigenschaft  dieser  Antriebe 
ist  in  dem  direkten  Zusammenhang  zwischen  den  elektrischen  Signalen  aus  dem 
Host  Computer  und  der  Drehbewegung  des  Schrittmotors  zu  sehen.  Durch  die  aus- 
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gereifte  Intel! igente  Steuerungssoftware  in  Verbindung  mit  einem  schnellen 
11  MHz-Mikrocontroller  ist  sie  einfach  zu  programmieren. 

Die  Interfacekarte  unterstutzt  die  Ansteuerung  von  insgesamt  drei  angeschlos- 
sener»  Schrittmotoren.  Oabei  werden  aus  den  tibergebenen  Informationen  wie  Bewe- 
gungsabstand  und  Geschwindigkeitssollwert  sowie  aus  den  intern  festgelegten 
Antriebsparametern  die  erforderlichen  Werte  fur  die  Start-  und  Stoprampe  be- 
reehnet. 

In  dem  angeschlossenen  Computer  werden  die  Befehle  fur  die  Bearbeitung  der 
notwendigen  Einzelschritte  erfaSt,  Die  erfaBten  Befehle  werden  iiber  die  seri- 
elle  Verbindung  zwischen  Computer  und  Interfacekarte  an  die  Schrittmotorsteue- 
rung  ubergeben.  Diese  Befehle  werden  von  der  Schrittmotorsteuerung  direkt  aus- 
gefiihrt  Oder  gespeichert.  Im  beschriebenen  System  werden  alle  Befehle  direkt 
ausgefiihrt.  Nach  dem  Empfang  der  Befehle  arbeitet  die  Interfacekarte  autonom, 

Der  Host  Computer  dient  als  eine  Kontrolleinheit.  Er  erzeugt  die  Befehle  nach 
Anforderung  des  Systems  und  gibt  diese  Befehle  zur  Interfacekarte  weiter. 

6)  Der  Drucker 

Der  Drucker  dient  zum  Druck  des  Bildes  auf  Papier. 

Die  kraftige,  aber  auch  komplizierte  Hardware  von  Max  Vision  wird  durch  eine 
machtige  und  ziemlich  einfache  Anwendungssoftware  unterstutzt.  Das  Hauptpro- 
gramm  der  Software  hat  eine  Dialogform.  Nach  der  Durchfuhrung  des  Hauptpro- 
gramms  wird  ein  Kontrollmenu  auf  dem  Monitor  gezeigt.  Auf  diesem  Menu  kann  man 
verschiedene  Kommandos  wahlen.  Das  Max  Vision  System  kann  von  drei  verschiede- 
nen  Niveaus  aus  kontrolliert  werden. 

1.  "Menu  Driven  Interface"  Niveau 

Bei  diesem  Niveau  konnen  die  Benutzer  verschiedene  Bildverarbeitungsrouti- 
nen  aus  verschiedenen  Kontrollmenus  benutzen.  Die  Ergebnisse  der  Verarbei- 
tung  werden  sofort  auf  dem  Monitor  gezeigt.  Man  braucht  keine  Kenntnisse 
uber  die  Programmiersprache. 
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2.  "Script  Operation  Interface"  Niveau 

Das  zweite  (Control Iniveau  zeigt  einen  sehr  einfachen  Weg  zur  Erzeugung 
vieler  anderer  Bildverarbeitungskommandos.  Bei  diesem  Niveau  kann  man  viele 
Funktionen  aus  der  Programmbibliothek  benutzen. 

3.  "C  Subroutine  Library  Interface"  Niveau 

Bei  diesem  niedrigsten  Kontrol lniveau  werden  Kenntnisse  iiber  die  Program- 
miersprache  C  gebraucht.  Die  Benutzer  konnen  viele  Anwendungsprogramme  mit 
C  direkt  schreiben.  All e  Unterprogramme  zur  automatischen  Fokussierung  sind 
direkt  in  C  geschrieben  und  im  Hauptprogramm  eingefiigt. 

7.2  Struktur  von  Fokussierunasreaelkreisen 

Im  Bildverarbeitungssystem  erfullt  die  automatische  Fokussierung  der  (Camera 
zwei  Aufgaben:  die  Erreichung  und  Erhaltung  der  besten  Fokussierung  der  (Came¬ 
ra.  Bei  der  Aufgabe  zur  Erreichung  der  besten  Fokussierung  sucht  die  Kamera  in 
einem  groBen  Arbeitsbereich  die  beste  Fokussierungsposition .  Bild  7.2  zeigt 
die  Grundidee  zur  Losung  dieses  Problems. 


M]d  7.2:  Struktur  des  geschlossenen  Regel kreises  zur  Erreichung  der 
besten  Fokussierung. 

Fur  diesen  Regel kreis  ist  der  Istwert  yfl(t)  die  Position  der  Kamera  p'(t).  Am 
Ende  des  Fokussierungsprozesses  befindet  sich  die  Kamera  in  der  besten  Fokus¬ 
sierungsposition.  Deshalb  ist  der  Sollwert  ye(t)  die  beste  Fokussierungsposi¬ 
tion  der  Kamera  p'^.  Man  weiB,  daB  das  Objekt  in  einer  gegebenen  Position 

nur  eine  beste  Fokussierungsposition  der  Kamera  besitzt.  In  Bild  3.1  ist  d'  , 

opt 
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nur  von  der  Position  des  Objektes  p'  abhangig.  Vor  dem  FokussierungsprozeB  1st 
der  Sollwert  yg(t)  unbestimmt,  weil  die  Position  des  Objektes  pg  unbekannt 
1st.  Der  Sollwert  von  dem  Fokussierungsregelkreis  1st  also  nur  ein  fiktiver 
Begriff. 


Oer  Block  Kamerapositionssteuerung  besteht  aus  der  Interfacekarle,  dem 
Schrittmotor  und  dem  Spindelschlittensystem.  GemaB  des  Signals  yj(t)  steuert 
dieser  Block  die  Bewegung  der  Kamera.  Das  HeBglied  besteht  aus  zwei  Teilen: 
Bilderzeugung  und  Bewertung  des  Fokussierungszustandes,  In  der  Position 
bekommt  die  Kamera  ein  Slid  vom  Objekt,  Wenn  das  Objekt  unbeweglich  ist  und 
die  Parameter  der  Kamera  festgelegt  sind,  ist  die  Bildqualitat  nur  von  ya  ab¬ 
hangig.  AnschlieBend  wird  der  Fokussierungszustand  durch  die  entsprechende 
Fokussierungsfunktion  FF  bewertet.  GemaB  der  Fokussierungsfunktion  FF  gibt  der 
Regler  das  Signal  y^t)  aus,  das  die  Bewegung  der  Kamera  kontrolliert. 

Zur  Analyse  der  Regelung  im  Sinne  eines  geschlossenen  Regelkreises  werden  die 
Antworten  auf  folgende  Fragen  gebraucht: 

a.  Wie  ist  die  Beziehung  zwischen  dem  Bild  g(x,y)  und  dem  Istwert  des  Systems 
y  .  Wenn  das  Objekt  bestimmt  und  unbeweglich  ist,  ist  die  Scharfe  des  Bil- 
des  von  ya  abhangig.  Das  scharfste  Bild  tritt  in  der  Position  ya  =  P#opt 
auf. 

b.  Wie  ist  die  Fokussierungsfunktion  FF  vom  Bild  g{x,y)  und  vom  Istwert  y& 

abhangig?  Die  Fokussierungsfunktion  FF  ist  in  den  meisten  Fallen  eine  uni- 
modul are  Funktion  vom  Istwert  ya<  Der  Extremwert  der  Fokussierungsfunktion 
tritt  in  der  Position  p'opt  auf.  Oie  f°rm  von  abhangig  v°n  der 

Textur  des  Objektes.  In  Wirklichkeit  ist  FF(ya)  eine  hochgradig  nichtlinea- 
re  Funktion  von  ya. 

c.  Wie  ist  die  Kameraposition  (Istwert)  ya  von  dem  Signal  y}  abhangig?  Es  ist 
dies  eine  Funktion  der  Mechanik  und  Elektronik  vom  Block  Kamerapositions¬ 
steuerung. 


d,  Wie  ist  das  Kontroll signal  y^  von  dem  Sollwert  yg  und  der  Fokussierungs¬ 
funktion  FF(y  }  abhangig?  Weil  yg  nur  ein  fiktiver  Begriff  ist,  kann  der 
Regler  y  nicht  direkt  benutzen.  Deshalb  ist  das  Kontrollsignal  nur  von  der 
Fokussierungsfunktion  FF{yg)  abhangig. 
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Um  den  Fokussierungsregel kreis  zu  analysieren,  ist  die  sogenannte  "Hill- 
Climbing*,-Strategie  ntitzlich  [18].  Weil  das  Kontroll signal  yj  nur  die  Fo¬ 
kussierungsfunktion  FF(y&)  benutzt,  ist  es  unmoglich,  die  Bewegungsricbtung 
der  Kamera  nur  mit  Hilfe  der  gegenwartigen  Fokussierungsfunktion  festzulegen. 
Um  die  Bewegungsrichtung  der  Kamera  zu  bekommen,  sind  die  fruhere  und  gegen- 
w$rtige  Fokussierungsfunktion  FFnl  bzw.  FFn  notwendig.  Ein  Kontrollalgorith- 
mus  ist  also  von  der  Form: 

i'ln  -  FtFFn.FFn_,)  .  (7.1) 

yJn  ist  das  gegenwartige  Kontrollsignal .  In  der  vorliegenden  Arbeit  ist  yJn 

nur  eine  Funktion  von  FF„  -  FF  also 
n  n-l’ 

yln  *  F<FFVFFn-l>  •  (7-2) 

Nun  ist  die  Fokussierungsstrategie  zu  der  sogenannten  "Hill-Climbingn-Strate- 
gie  entartet.  Wahrend  des  Fokussierungsprozesses  wird  die  Fokussierungsfunk¬ 
tion  berechnet,  dann  bewegt  sich  die  Kamera.  In  der  neuen  Position  wird  die 
Fokussierungsfunktion  erneut  gemessen.  AnschlieBend  wird  die  VerSnderung  der 
Fokussierungsfunktion  gepriift.  Wenn  die  Fokussierungsfunktion  abnimmt,  bedeu- 
tet  das,  daB  die  Bewegungsrichtung  falsch  ist.  Die  Kamera  muB  zuruckfahren, 
sonst  ist  die  Bewegungsrichtung  der  Kamera  richtig.  In  der  besten  Fokussie- 
rungsposition  wird  die  Kamera  stehenbleiben. 


Jetzt  kann  man  die  Funktion  F  so  bestimmen,  daB,  wenn  FFn-FFn_j  >  0  ist,  yJn 
positiv  ist.  Sonst  bekommt  yln  einen  negativen  Wert.  Ein  Regler  mit  solcher 
Eigenschaft  ist  der  sogenannte  Zweipunktschalter,  dessen  Kennlinie  in  Bild  7.3 
gezeigt  ist. 


FFn 


l 


Bild  7.3:  Kennlinie  des  Zweipunktschalters. 
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Das  Kontroll signal  1st  dann 


yln  -  k*sgn{FFn-FFn_j) 


(7.3) 


k  ist  die  Verstarkung.  Die  "Hi11-Climbing*-Fokussierungsstrategie  benutzt  in 
der  vorliegenden  Arbeit  eine  konstante  SehrittgroBe  des  Schrittmotors  anstatt 
der  konst anten  Verstarkung,  d.h.  die  Kamera  fahrt  nach  der  Berechnung  der 
Fokussierungsfunktion  in  einem  fasten  Abstand  in  die  richtige  Richtung, 

Die  Auswahl  der  SehrittgroBe  ist  sehr  wichtig  filr  die  Fokussierungsgeschwin- 
digkeit  und  die  Zuverlassigkeit  der  Fokussierung.  Wenn  sie  zu  groB  ist,  kann 
die  Kamera  zwar  sehr  schnell  in  die  Nahe  der  besten  Fokussierungsposition  fah- 
ren,  die  Kamera  schwingt  aber  in  der  Nahe  der  besten  Fokussierungsposition  um 
diese  Position.  Hit  einer  zu  kleinen  SehrittgroBe  andererseits  findet  die  Ka¬ 
mera  die  beste  Fokussierungsfunktion  zwar  zuverlassig,  die  Fokussierungszeit 
ist  aber  zu  lang.  Um  das  Problem  zu  optimieren,  wird  der  FokussierungsprozeB 
in  drei  Phasen  aufgeteilt. 

a)  Erste  Phase:  grobe  Fokussierung. 

In  dieser  Phase  braucht  die  Kamera  die  beste  Fokussierungsposition  nur  grob 
zu  suchen.  Deshalb  ist  die  SehrittgroBe  sehr  groB  gewahlt.  Die  SehrittgroBe 
in  dieser  Phase  ist  10  mm.  Am  Anfang  des  Fokussierungsprozesses  ist  die 
Kamera  normalerweise  sehr  weit  vom  Objekt  entfernt.  Die  Kamera  befindet 
sich  im  unwirksamen  Bereich.  In  diesem  Bereich  ist  die  Fokussierungsfunk¬ 
tion  wegen  des  Rauscheinflusses  nicht  immer  monoton  zunehmend  oder  abneh- 
mend.  Am  Ende  der  ersten  Phase  wird  die  Kamera  bis  zum  Punkt,  wo  die  Fokus¬ 
sierungsfunktion  die  Bedingung 


FFft  -  FF„  i  <  0 
n  n-i 


(7.4) 


erfullt  1st,  fahren.  Im  idealen  Fall,  d.  h.  das  Bild  ist  nicht  durch  das 
Rauschen  verfalscht,  ist  die  Kamera  jetzt  die  beste  Fokussierungsposition 
iiberwunden.  Aber  wegen  des  Rauscheinflusses  ist  die  FF  nicht  mehr 
unlmodular.  In  diesem  Fall  kann  die  Bedingung  (7.4)  im  unwirksamen  Bereich 
auch  erfQllt  werden.  Deshalb  muB  die  Bedingung  (7.4)  verandert  werden  gemaB 


FFn  '  FFn-l  <  ~AF  * 


(7.5) 
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AF  ist  eine  positive  Konstante,  die  experimentell  zu  bestimmen  ist.  Norma- 
lerweise  ist  die  Veranderung  der  Fokussierungsfunktion  im  unwirksamen  Be- 
reich  sehr  klein  im  Vergleich  zu  dem  Bereich  in  der  Nahe  der  besten  Fokus- 
sierungsposition. 

b)  Zweite  Phase. 

In  dieser  Phase  ist  die  SchrittgroBe  der  Kamera  auf  5  mm  gesetzt.  Die  Kame 
ra  befindet  sich  im  wirksamen  Bereich.  Weil  am  Ende  der  ersten  Phase  die 
Kamera  die  beste  Fokussierungsposition  iiberschreitet,  muB  die  Kamera  zu- 
ruckfahren.  Die  zweite  Phase  endet  in  der  Position,  wo  die  Bedingung  (7.4) 
erneut  erfullt  ist. 

c)  Dritte  Phase:  genaue  Fokussierung. 

Am  Ende  der  zweiten  Phase  liegt  die  Kamera  ganz  in  der  Nahe  der  besten  Fo¬ 
kussierungsposition.  In  dieser  Phase  fahrt  die  Kamera  in  der  umgekehrten 
Richtung  zur  zweiten  Phase  mit  der  SchrittgroBe  1  mm.  Wenn  die  Kamera  die 
beste  Fokussierungsposition  nochmals  uberwindet,  fahrt  die  Kamera  1  mm  zu- 
riick  und  hat  die  beste  Fokussierungsposition  gefunden.  Der  Fokussierungs- 
prozefi  zur  Erreichung  der  besten  Fokussierung  ist  dann  beendet. 

Der  Computer  als  Regler  hat  folgende  Aufgaben: 

1.  Berechnung  der  Fokussierungsfunktion, 

2.  Festlegung  der  Fokussierungsphase, 

3.  Festlegung  der  Bewegungsrichtung  der  Kamera, 

4.  Ermittlung  der  besten  Fokussierungsposition. 

7.3  Obertraqunqsfunktion  des  Fokussierungsreaelkreises 

Die  Aufgabe  des  Reglers  zur  Aufrechterhaltung  der  besten  Fokussierung  ist  die 
Suche  der  besten  Fokussierungsposition  im  kleinen  Bereich.  Die  Voraussetzung 
dafiir  ist,  daB  die  Kamera  sich  in  der  Nahe  der  besten  Fokussierungsposition 
befindet.  Nach  dem  ProzeB  zur  Erreichung  der  besten  Fokussierung  liegt  die 
Kamera  in  der  besten  Fokussierungsposition.  Wenn  das  Objekt  sich  in  einem 
kleinen  Bereich  verschiebt  oder  die  Parameter  der  Kamera  sich  verandern,  ist 
die  Kamera  vom  besten  Fokussierungszustand  abgewichen.  Hit  Hilfe  des  Reglers 
zur  Erhaltung  der  besten  Fokussierung  kann  die  Kamera  die  beste  Fokussierungs 
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position  wiederfinden,  Weil  die  Kamera  sich  in  der  Nahe  der  besten  Fokus- 
slerungspositlon  befindet,  karm  dieser  Regel kreis  durch  die  System! inearisie- 
rung  als  eln  lineares  System  behandelt  werden. 


Bild  7,4:  Fokussierungsregel kreis  zur  Erhaltung  der  besten  Fokussierung. 

In  Bild  7.4  wird  der  Sollwert  des  Systems  y^  als  das  Differential  der  Fokus¬ 
sierung  sfunkt  ion  gewahlt.  Weil  die  Fokussierungsfunktion  den  Extremwert  in  der 
besten  Fokussierungsposition  erreicht  hat,  1st  ihr  Differential  in  dieser  Po¬ 
sition  immer  Hull.  Deshalb  1st  der  Sollwert  immer  0.  Die  Obertragungsfunktion 
der  MeBeinrichtung  1st  1.  Wenn  das  System  stabil  ist,  ist  der  Istwert  y' 
glelch  dem  Sollwert  y' ,  also  die  Kamera  liegt  In  der  besten  Fokussierungsposi- 
tlon. 

Die  Verschiebung  des  Objektes  und  die  Veranderung  der  Parameter  kann  man  als 
Systemstorung  behandeln.  Deshalb  ist  die  Hauptfunktion  des  Regelkreises  in 
Bild  7.4  die  Unterdriickung  der  Systemstorung.  Das  Storsignal  z(t)  tritt  vor 
den  Block  Bildverarbeitungssystem.  Es  verandert  den  Abstand  zwischen  der 
Kamera  und  dem  Objekt.  Die  physikalische  Bedeutung  von  z{t)  kann  so  erklart 
werden,  daB  das  Objekt  plotzlich  um  einen  Abstand  z(t)  verschoben  wird. 

1.  Obertragungsfunktion  der  Interfacekarte  Gj{s). 

Die  Interfacekarte  im  System  kann  als  ein  Totzeitglied  behandelt  werden.  Die 
Totzeit  T  ist  die  Zeit  zur  Behandlung  der  Anweisung  vom  Host  Computer.  Durch 
das  Experiment  kann  man  die  Totzeit  T  messen.  Sie  betragt 


T  =  0,3  (Sekunde) 
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Unter  einer  Totzeit  versteht  man  die  Erscheinung,  daB  eine  zeitlich  veran- 
derliche  Gr6Be,  die  am  Eingang  eines  Blockes  wirkt,  an  dessen  Ausgang  erst 
nach  einer  gewissen  Zeit,  aber  sonst  unverandert,  in  Erscheinung  tritt.  Mathe- 
matisch  formuliert  heiBt  das 

y2(t)  -  yj(t-T)  .  (7.6) 

Die  Obertragungsfunktion  eines  Totzeitgliedes  mit  der  Totzeit  T  ergibt  sich 
direkt  nach  dem  Verschiebungssatz  der  Laplace-Transformation  zu 


Gj(s)  .  e-T‘s  .  (7.7) 

Es  gilt,  die  transzendente  Funktion  (7.7)  durch  ein  Polynom  oder  den  Quotien- 
ten  zweier  Polynome  anzunahern.  Die  Funktion  (7.7)  hat  fur  alle  Frequenzen  den 
Betrag  1;  das  Argument  nimmt  linear  mit  der  Frequenz  zu.  Soil  die  approximie- 
rte  rationale  Funktion  ebenfalls  fur  alle  Frequenzen  den  Betrag  1  haben,  so 
miissen  Zahlerpolynom  und  Nennerpolynom  zueinander  konjugiert  komplex  sein. 


Die  Funktion  ist  also  von  der  Form 


aQ  -  aj-s-T  +  a2- (s-T)2  -  +  ... 
aQ  +  aj-s-T  +  a2-(s-T)2  +  ... 


(7.8) 


Die  Werte  der  Koeffizienten  aQ,  aj,  ...  sind  nun  so  zu  wahlen,  daB  der  ge- 
wiinschte  lineare  Verlauf  des  Winkels  uber  den  interessierenden  Frequenzbereich 
moglichst  gut  angenahert  wird. 


Die  Entwicklung  der  Funktion  (7.7)  in  ein  Polynom  (7.8)  unter  diesen 
Gesichtspunkten  fiihrt  auf  die  sogenannte  Pade-Approximation.  Zur  Vereinfachung 
wird  das  Totzeitglied  hier  durch  die  Pade-Approximation  erster  Ordnung 
angenahert  [36],  [37] 


Gj(s)  = 


1  -  0.5-T-s 
1  +  0,5-T-s 


(7.9) 
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2)  Obertragungsfunktion  des  Schrittmotors  Gg{s), 

Zur  Ansteuerung  mit  ProzeBrechnern  oder  digitalen  Reglern  1st  der  Schrittmotor 
besonders  geeignet.  Der  Schrittmotor  hat  ein  zu  jedem  Impuls  proportionales 
Verhalten  und  kann  unter  Einsparung  eines  A/D  Handlers  "dlrekt"  digital  ange- 
steuert  warden  [38,  39].  Der  angeftihrte  Vorteil  fur  die  Positioniersteuerungen 
bezieht  sich  auf  das  einfache  Steuerkonzept.  Der  Antrieb  kann  lagegesteuert 
betrieben  werden,  d.h.  er  benotigt  keine  tageregeleinrichtung  und  keine  Ge- 
schwindigkeitsregelung.  Die  Lage  wird  durch  die  Anzahl  der  Impulse  gesteuert 
und  die  Geschwindigkeit  durch  die  Schrittfrequenz.  Daher  kann  der  Schrittmotor 
als  ein  Proportionalglied 

62(s)  -  k2  (7.10) 

betrachtet  werden.  Der  Computer  als  Regler  gibt  den  Befehl  aus.  Die  Interface- 
karte  wandelt  diesen  Befehl  in  das  Geschwindigkeitssignal  y2  um  und  kontrol- 
llert  so  die  Geschwindigkeit  des  Schrittmotors.  Der  Schrittmotor  bewegt  sich 
mit  der  Geschwindigkeit  y3  =  y2>  deshalb  ist  die  Konstante  k2  *  1. 

3)  Obertragungsfunktion  vom  Spindelschlittensystem  G3(s). 

Das  Spindelschlittensystem  wandelt  die  Drehung  des  Schrittmotors  in  eine  Line- 
arbewegung  des  Schlittens  um.  Es  ist  ein  Integrationsglied  mit  der  Obertra¬ 
gungsfunktion 


Wenn  sich  der  Schrittmotor  400  Schritte  bewegt,  fahrt  das  Spindelschlit¬ 
tensystem  1  mm.  Deswegen  ist  die  Konstante  k3 

k3  =  450  C™/Schritt)  * 

4)  Obertragungsfunktion  vom  Bildverarbeitungssystem  (s) . 

Der  Eingang  dieses  Obertragungsgliedes  ist  die  Position  der  Kamera  p'(t).  Der 
Ausgang  ist  das  Differential  der  Fokussierungsfunktion,  also 


.  mm 

dp'CtJ 


(7.12) 
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Es  wird  angenommen,  daB  slch  vor  dem  Auftreten  elner  Stdrung  die  Kamera  in  der 
besten  Fokussierungsposition  befindet.  Die  beste  Fokussierungsposition  wird 
dann  als  der  Ursprung  von  p'(t)  benutzt. 


Bild  7.5:  Differential  der  Fokussierungsfunktion. 

Die  Beziehung  zwischen  (t)  und  p'(t)  ist  im  groBen  Bereich  total  nichtl inear 
(Bild  7.5).  Wenn  der  Absolutwert  der  Storung  kleiner  als  b  ist,  also  die  Kame- 
ra  in  der  Nahe  vom  Ursprung  arbeitet,  kann  die  Beziehung  zwischen  y^(t)  und 
p'(t)  durch  Linearisierung  als  linear  angenommen  [40],  [41]  werden.  Dann  ist 
das  Bildverarbeitungssystem  durch  ein  lineares  Ubertragungsglied  angenahert. 
Der  Arbeitspunkt  fur  die  Linearisierung  ist  der  Ursprung.  Im  Bereich  (-b,b) 
gilt 


k4  ist  hier  eine  positive  Konstante.  Deshalb  ist  die  Obertragungsfunktion 
64(s) 


G4(s)  =  k4  .  (7.14) 

Die  Bestimmung  von  k4  ist  sehr  kompliziert.  Normalerweise  ist  die  Konstante  k4 
von  Objekt  zu  Objekt  verschieden.  Wenn  alle  Parameter  der  Kamera  festgelegt 
sind,  ist  k4  nur  von  der  Textur  des  Objektes  abhangig.  Im  ProzeB  vor  Erreichen 
der  besten  Fokussierung  kann  k4  gemessen  werden. 
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Well  die  Hauptaufgabe  vom  Fokussierungsregel kreis  in  Slid  7.4  die  Unter- 

drOckung  von  Stdrungen  1st,  soil  nun  untersucht  werden,  wie  slch  die  Storung 

z(t)  auf  den  Istwert  y'(t)  auswirkt,  Oa  eln  llneares  System  vorllegt,  UBt 
« 

slch  der  EinfluS  der  Stdrung  z(t)  auf  y*(t)  getrennt  von  dem  von  y*(t)  behan- 
deln.  In  Wirkllchkeit  1st  y^Ct)  eh  Immer  glelch  0.  Fur  die  Stdrung  z(t)  ergibt 
slch  die  Obertragungsfunktion 

Y'(s)  -  Sz(s)*Z(s)  , 

S4(s) 

¥s>  ■  l+Sr.{s)-G1(S).G2(s).G3<S).G4Csy  •  (7-15) 

Setzt  man  die  konkreten  Funktlonen  fOr  Gj(s),  G2(s),  fi3(s},  G4(s)  In  (7,15) 
eln,  so  folgt 


40G‘k4«s* (l+0,15*s) 

Ms>  =  400*s*  ( 1+0, 15*  s)  +  k4*Gf(s)‘  (1-0,15-s)  *  (7*16} 

7.4  Reolerentwurf 

Ole  Aufgabe  des  Entwurfs  vom  Regler  besteht  zunachst  darin,  elnen  geeigneten 
Regler  zu  wthlen.  Insbesondere  ist  zu  untersuchen,  welcher  Regler  tQr  best 1mm* 
te  Regel ungs auf gaben  vorteilhaft  1st  und  wle  man  die  Parameter  des  Reglers 
wShlt,  damlt  der  Regel kreis  die  an  ihn  gestellten  Anforderungen  erfullt  [42]. 

Die  erste  und  wichtigste  Anforderung  an  den  Regler  ist  die  Stabilitat  des  Re¬ 
gel  kreises.  Nach  Verstellung  des  Sollwertes  y'{t)  Oder  der  Storung  z(t)  muS 
der  Istwert  mit  wachsender  Zeit  wieder  einen  festen  Wert  annehmen,  sonst  ist 
der  Regel kreis  unbrauchbar. 

Die  zwelte  Anforderung  an  den  Regler  ist,  daS  der  Regelkreis  eine  bestlmmte 
statlonire  Genauigkeit  aufweisen  muB,  Ist  der  Regelkreis  stabil,  so  strebt  der 
Istwert  y'{t)  nach  einer  sprungartigen  Mnderung  des  Sollwertes  y'Ct)  oder  der 
Stdrung  z(t)  mit  wachsender  Zeit  einem  festen  Wert  zu.  Es  geniigt  aber  nicht, 
daB  dies  irgendein  fester  Wert  ist.  Vielmehr  muB  der  Istwert  den  gewQnschten 
Sollwert  annehmen  oder  ihm  zumindest  nahekommen. 


Die  drltte  Anforderung  wird  an  die  Dynamlk  des  Regelkrelses  gestellt.  Die  Ant- 
wort  des  Regelkrelses  auf  einen  Fuhrungsgr58ensprung  muB  genQgend  schnell, 
aber  auch  genQgend  gedampft  seln. 

AuBerdem  muB  die  Struktur  des  Reglers  so  einfach  wle  mogllch  sein,  damit  der 
Regler  lelcht  reallslert  werden  kann. 

FGr  den  Regelkrels  zur  Errelchung  der  besten  Fokusslerung  in  Bild  7.2  ist  der 
Regler  als  Zwelpunktschalter  ausgewahlt  worden.  Der  elnzige  Parameter  1st  die 
Konstante  AF  in  Glelchung  (7.5).  Weil  der  Regelkrels  total  nlchtl inear  1st, 
wird  diese  Konstante  durch  die  Experimente  bestimmt.  Im  nachsten  Abschnitt 
wird  das  Zeitverhalten  des  Regelkrelses  fur  verschiedene  Werte  AF  durch 
Experimente  untersucht. 


1)  PI -Realer 

Als  Regler  wird  zuerst  ein  PI-Regler  mit  der  Obertragungsfunktion 


Gr(s) 


1  +  Tr.s 


(7.17) 


verwendet.  Der  PI-Regler  besitzt  das  gunstige  Zeitverhalten  des  P-Reglers.  Der 
P-Anteil  des  Reglers  sorgt  fur  eine  hinreichende  Schnell igkeit.  Mit  seinem 
I-Anteil  behebt  er  dessen  nachteilige  bleibende  Regel abwei chung. 


Bei  der  in  Bild  7.4  gezeichneten  Konfiguration  lautet  die  Obertragungsfunktion 
des  offenen  Kreises 


G0(s)  *  Gr(s)-G1(s).G2(s)-G3(s).G4(s)  , 

(1-0,15-s)- (1+T  * s) 

»  k — 2 - 1 —  *  (7-18) 

s^- (1+0,15-s) 


wobei  die  Abktirzung 
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elngeffihrt  wird.  Wie  1st  die  Zeitkonstante  Tf  des  Reglers  zu  wihlen  und  wel- 
chen  Wert  muB  die  Verstirkung  kf  des  Reglers  haben,  damlt  der  Regel kre Is  be- 
frledigendes  Storverhal ten  aufwelst*  also  Insbesondere  stabll  1st?  Dies  soli 
durch  Anwendung  des  Kri ter 1 urns  von  Hurwltz  oder  des  Nyqulst-Krl ter 1  urns  unter- 
sucbt  warden, 

a)  In  dem  ersten  Versuch  wird  der  fiber  0,15  auftretende  Pol  von  (7.18)  kompen- 
slert.  Setzt  man  Tf  -0,15  ,  dann  erglbt  slch  die  Obertragungsfunktlon  des 
offenen  Regel kreises 


Gfi(s)  -  k.ikMlllL  ,  (7,20) 

s* 

Die  charakterlstische  Gleichung  des  geschlossenen  Regel kreises  lautet 

X2  -  0,15*k*A  +  k  -  0  .  (7.21) 

Dieser  Regelkrels  1st  immer  instabll,  da  in  der  charakteristischen  Glei¬ 
chung  eln  Koefflzient  negatlv  1st,  so  da8  die  notwendlge  Stabll Itatsbedin- 
gung  nach  Hurwltz  verletzt  1st. 

b)  In  elnem  zweiten  Versuch  wird  die  Zeitkonstante  Tf  nlcht  auf  0,15  gesetzt. 
Die  Obertragungsfunktlon  des  offenen  Regel kreises  ist  (7.18). 

FOr  den  Frequenzgang  gilt  damit 


(1-0,15* jw}* (1+T*jw) 

k - * - r- - 

(ju)Ml+0,15*jw) 


Das  Aufspalten  von  F^jw}  in  Real-  und  Imaginarteil  liefert 


(7.22) 


k* (0,152*«2-0,3*T  *«2-l)  k* (T  -0,15Z*w2*T  -0,3) 
F0(^)  -  - 1 - T-T- - J* 


^•(1+0,15^7) 


a*(l+0,15Z*yZ) 


(7.23) 
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Wenn  Tf  >  0,3  1st,  hat  die  Ortskurve  demnach  qualltativ  die  In  Bild  7.6a  ge- 
zelgten  VerlSufe. 


Bild  7.6:  Ortskurve  des  offenen  Regelkreises  mit  PI-Regler. 


Wenn  ^  <  -  1  1st,  dann  ist  der  geschlossene  Regelkreis  immer  Instabll.  Geht 
die  Ortskurve  des  Frequenzganges  durch  den  Punkt  «  -  1,  so  fOhrt  der  ge¬ 
schlossene  Regelkreis  stationare  Dauerschwlngungen  mit  der  zu  gehorenden 
Frequenz  ti>k  aus.  Nur  wenn  >  -  1  1st,  ist  der  geschlossene  Regelkreis  sta- 
bil.  Die  zu  ^  gehorende  Frequenz  laBt  sich  durch 

T  -0,152-u2-T  -0,3 

TJ  =  -  k.-H - =  0  (7.24) 

w- (1+0,15  •(/) 

berechnen.  Lost  man  diese  Gleichung  auf,  dann  erhalt  man 


w  *  - 

K  o,i5.|r; 


Setzt  man  w  *=  a>k  in 


t 


0,152-w2-0,3-T  -u2-l 

k — - * — * - 

(/•  (1+0,15  •{/) 


(7.25) 


(7.26) 


ein,  so  ergibt  sich 
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0,152  +  T2  -  0t3.Jr 
ek  *  ”  0,3‘Tr‘k*  (2*Tr-0, 3)  •  (tr-0,'3T 

Venn  >  -  1  1st,  mu8 

<M  -0,3).<T  -0,3) 

j£  <  r  _  *_ 

0,3-Tr-(0,15J+Tj-0,3-Tr) 


bzw. 


C7-27) 


(2.28a) 


400* (2*T  -0,3) * (T  -0,3) 

^  _ r _  r _ 

r  O»3*Tr*k4*(0,152+T2  0,3  Tr) 

seln.  In  dlesem  Fall  1st  der  geschlossene  Regelkreis  stabll. 


(2.28b) 


iienn  0,15/2  <  Tr  <  0,3  1st,  nlmmt  die  zu  (7.23)  gehorende  Ortskurve  die  In 
Blld  7.6b  gezeigte  Form  1  an.  Die  Form  2  in  Bild  7.6b  stellt  die  Ortskurve  von 
<  0,15/2  dar.  Damlt  1st  aber  mlt  dem  Stabll ItStskriterium  von  Nyquist  der 
geschlossene  Regelkreis  In  beiden  Fallen  instabil.  Die  Stabilititsbedlngung 
des  Regel kreises  mit  PI-Regler  1st  dann 


tr  >  0,3 

4O0*(2*Tr-0,3).(Tr-0,3) 

kf  <  0,3.Tr.k4-(0,15Z+Tj-0,3Tr)  .  (7'Z9) 

Menn  eine  sprungartige  Storung  Z(s)  =  1/s  auftritt,  muB  der  Endwert  des  1st- 
wertes  y^{t)  Null  sein,  damit  der  Regel kreis  keine  stationare  Regel abweichung 
hat,  Es  1st 


v;(s)  -  ^2(s) *2(s)  , 

k4*(l+0,15*s)*s 

o7l5*s3  +  (l-0,15*Tr*k)*sZ  +  (Tf-0,15)*k*s  +  k 


.(7.30) 
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Mit  Hilfe  des  Endwertsatzes  der  Laplace-Transformatlon  folgt  sofort 

11m  y'(t)  -  lira  s»Y'(s)  •  0  .  (7.31) 

t-a>  1  S-»0  * 

Die  Festlegung  der  Parameter  kr  und  Tr  des  Reglers  spiel t  die  entscheidende 
Rolle  fUr  die  Dynamik  des  Regel kreises.  Urn  das  Problem  zu  vereinfachen,  wird 
die  Zeitkonstante  Tr  zuerst  auf  0,4  gesetzt.  Dann  ist  nur  die  VerstSrkung  des 
Reglers  kf  festzulegen.  Um  den  konkreten  Wert  von  kf  zu  bekommen,  wird  das 
Verfahren  der  Minimierung  nach  dem  linearen  Integral kriterium  eingesetzt  [43] 
Diese  Methode  steht  in  engem  Zusammenhang  mit  den  parameteroptimalen  Reglern. 
FQr  den  Regel kreis  zur  Erhaltung  der  besten  Fokussierung  muB  der  Istwert  y', 

a 

also  das  Differential  der  Fokussierungsfunktion,  nach  dem  Auftreten  der  Sto- 
rung  schnell  wieder  zu  0  gehen.  Man  geht  dabei  so  vor,  daB  das  Integral  Qber 
y'(t),  also 

00 

j(k)  -  |  <y' )2-dt  (7.32) 

minimiert  wird.  Zieht  man  nun  den  Faltungssatz  der  Laplace-Transformation  her 
aus,  dann  kann  (7.32)  auch 


+j<D 

J(k)  "  2F3  I  <7-33) 

-jm 

geschrieben  werden.  Dabei  wird  angenommen,  daB  die  Storung  ein  Einheitssprung 
ist.  Man  kann  dann  Y^(s)  und  Tr  =  0,4  in  (7.33)  einsetzen.  Das  Integral  J(k) 
laBt  sich  berechnen.  Es  lautet 


J(k) 


0,15-0,25-k  +  1 
l-k-0,06-0,25-k 


2 


(7.34) 


Es  wird  nun  J(k)  nach  dem  Parameter  k  minimiert,  d.h.  aus  den  notwendigen  Be 
dingungen  dO(k)/dk  =  0  folgt  die  Bestimmungsgleichung 


k4  0,0005625-k2  ±  0,03>k  -  0,1 
2  (0,1 • k-0,015-k2)2 


0 


(7.35) 
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LSst  man  diese  Gleichung  auf,  so  ergibt  sich  k  -  3,15  Oder 

k  -  4e2iUS  .  (7.36) 

r  k4 

Die  Parameter  kf  und  Tf  kdnnen  die  StabilitStsbedingung  (7.29)  erfGllen,  FUr 
¥'{s)  folgt  dann 

a 


{s246t67»s).k4 
s3  +  5,41- s2  +  5,25- s  4  21 


(7,37) 


Als  Ergebnis  des  Regl erentwurf s  erhilt  man  fOr  den  geschlossenen  Regel kre is 
eine  Obertragungsfunktion  3.  Ordnung.  Um  das  dynamlsche  Storverhalten  des  Re- 
gelkrelses  zo  bewerten,  wird  ¥^(s)  zuerst  in  den  Zeitbereich  transformiert. 
Weil  die  charakterlstlsche  Gleichung  3.  Ordnung  1st,  1st  es  sohwer,  die  Eigen- 
werte  der  charakterlstischen  Gleichung  zu  bekommen.  Deshalb  wird  y'(t)  hier 
durch  digitale  Simulation  berechnet.  Die  dlgitale  Simulation  besteht  darln, 
mit  Hilfe  eines  Rechners  fur  ein  gegebenes  mathematisches  Systemmodell  in  Form 
gewohnlicher  Zustandsgleichungen 


•  f1<xl>x2 . VU>  •  ,,.38, 

ll  -  1,2 .  n 

und  ausgehend  von  bekannten  Anfangswerten  x^(tQ)  und  fur  eine  vorgegebene 

A  ^  A 

Eingangsgr88e  u(t)  uber  einen  Simulatlonszeitraum  T,  wobei  tg  <  t  <  tg  4  T 
jjllt*  die  zeitl ichen  Verlaufe  der  n  Zustandsvariablen  x^t)  zu  ermitteln.  Es 
1st 


Y'(s)  -  Gz(s).Z(s) 


(s346,67*s2)*k4 

1 - 2 - ’ - *Z(S) 

s 6  4  5,41.s*  4  5,25-s  4  21 


Die  zugehorige  Differential gleichung  lautet 


(7.39) 


y'(t)45,41.y^{t)45,25.y;(t)421.y;(t)  -  k4.I(t)46,67.k4.z(t)  , 

“  r^o)  -  y'co)  =  o  .  (7.40) 
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Man  beginnt  mit  elner  Umformung  von  Gleichung  (7.40)  in  Zustandsform,  wobei 
man  als  Zustands variable  definiert: 

X1  "  *a(t>  ‘  k4'z^>  • 

x2  «  5,41-y'(t)  +y;(t)  -  6,67.k4-z(t)  -  k4*z(t)  , 

x3  -  5,25- y'(t)  +  5,41-y;(t)  +  y'(t)  -  6,67.k4±(t)  -  k4-z(t)  . 

(7.41) 

Das  der  Gleichung  (7.40)  aquivalente  Differentialgleichungssystem  3.  Ordnung 
lautet 

Xj  -  -  5,41-Xj  +  x2  +  1 , 26- k4- z(t)  , 

x2  -  -  5 , 25- Xj  +  x3  -  5,25.k4*z(t)  ,  (7.42) 

x3  -  -  21-Xj  -  21 • k4- z(t) 

mit  Xj(0)  =»  x2(0)  =  x3(0)  *  0.  Der  Istwert  y'(t)  ist  dann 

y'(t)  *  Xj(t)  +  k4-z(t)  .  (7.43) 

Zur  Simulation  wird  das  bekannte  Runge-Kutta-Verfahren  4.  Ordnung  verwendet. 
Der  Algorithmus  in  der  am  haufigsten  verwendeten  Version  aus  [44]  ist: 

xtK+l  ’  xitc  +  r<k11+2-ki2+2-ki3+ki4>  (7-44> 


mit 


k11  ”  f1 ^xlK,x2K. — .xnK’uK^  * 

k12  ‘  f  1  <xltc+h •  k1 1/2 ’x2K+h - k, i/2 . X^h.^j/Z.u^)  . 

kj3  -  f.(xlK+h.kj2/2,x2K+h.k12/Z . x„K+hk12/2.UK+%)  • 

ki4  >  fl(x,K+h-ki3  ,x2Kth.ki3 . xnrh-kj3,uE+1)  . 


Oabei  1st 
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XE  *  “  x(t0+S-h) 

a  (7,45) 

£  -  0,  l,  ...»  K  mlt  K  -  T/h  .  K  1 

h  -  t£+J  -  tj-  1st  der  Zeltschrltt  der  Simulation,  In  der  vorllegenden  Arbeit 

werden  T  *  5(s)  und  h  =  0,OGl(s)  ausgewihlt.  Das  Ergebnis  der  Simulation  wlrd 
In  Bild  7.7  gezeigt.  In  diesem  Abschnltt  wlrd  k^  auf  1  gesetzt. 


Die  Kurve  2  in  Bild  7,7  zeigt,  daB,  wenn  eine  sprungartige  Storung  z(t)  auf- 
tritt,  der  Istwert  y'(t)  langsam  gedampft  wird.  Desha! b  benbtigt  der  Regel - 
-kreis  sehr  lange  Zeit,  um  den  Istwert  y'(t}  =  0  zu  erreichen.  Da  der  Vorwarts- 
weg  des  Regelkreises  ein  I-Glied  enthalt,  so  darf  der  Regler  im  allgemeinen 
nicht  auch  noch  einen  I-Anteil  haben.  Fur  den  Rsgelkreis  in  Bild  7.4  ist  der 
PI-Regler  deshalb  ungeeignet. 

2)  pp-Reqler 

Wenn  die  Obertragungsfunktion  des  offenen  Regelkreises  ein  I-Glied  enthalt, 
pflegt  man  einen  PD-Regler  einzufuhren.  Der  D-Anteil  ist  bei  Anderung  der 
StorgroSe  wirksam.  Er  bewirkt,  daB  das  Stell signal  des  Reglers  nicht  nur  ab- 
hanglg  von  der  Regel differenz  1st,  sondern  auch  von  deren  Anderungsgeschwin- 
dlgkeit.  Der  PD-Regler  1st  in  seiner  idealen  Form  durch  die  Obertragungsfunk¬ 
tion 
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Gr(s)  -  kr- (l+Tr-s)  (7.46) 

charakterisiert.  In  diesem  Fall  lautet  die  Obertragungsfunktion  des  offenen 
Regel kreises 

(l-0t15*s).(l+T  -s) 

60<s>  ■ k — irraTTFiy  v-m 

mit  k  -  (kr*k4)/400.  Der  PD-Regler  kann  die  Streckenzeitkonstante  0,15  kompen- 
sieren.  Wenn  Tf  -  0,15  ist,  folgt  sofort 

G0(s)  -  k^1-^15-'^-  .  (7.48) 

Die  Storiibertragungsfunktion  des  geschlossenen  Regel kreises  lautet  dann 

Gz(s)  -  J]To,r54k).s+k  *  (7'49) 

In  diesem  Fall  lautet  die  Stabilitatsbedingung 


k  < 


0,15 


bzw. 


kr  < 


400 

0, 15*k4 


Die  Laplace-Transformierte  des  Istwertes  fur  Z(s)  »  1/s  ist 


(7.50) 


Ya(s)  =  (1-0, 15^k) - s  +  k  *  (7*51) 

Der  Parameter  k  bzw.  kr  wird  wieder  mit  Hilfe  der  Parameteroptimierung  mittels 
des  Gute-Index  (7.33)  ermittelt.  Setzt  man  (7.51)  in  (7.33)  ein  und  fiihrt  die 
Integration  durch,  so  erhalt  man 


2- (1-0, 15- k) • k 


J(k)  = 


(7.52) 
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Aus  der  notwendigen  Bedingung 


k|  -  1  +  0,3*k 
2  (1-0,15- k)2*k2 


(7.53) 


erhalt  man  fur  den  Parameter  k  den  Wert  1/0,3.  Der  Reglerparameter  kr  ist  also 


Wird  k  in  (7.51)  eingesetzt,  so  erhalt  man 


(7.54) 


¥'{s) 


Z~k4 
s  +  6 


Durch  Rucktransformatlon  von  ¥'(s)  folgt 


(7,55) 


y'(t)  »  2*k^*exp(-6*t)  ,  (7.56) 

Der  Istwert  y'(t)  hat  in  diesem  Fall  einen  exponent! el len  Verlauf  ohne  Ober- 

a 

schwingungen. 

Nun  wird  der  Fall  ungleich  0,15  untersucht.  So  kann  der  Regler  die 
Streckenzeitkonstante  0,15  nicht  kompensieren.  tlm  die  Stabilitttsbedingung 
festzulegen,  wird  das  Nyquist-Kriterium  erneut  benutzt.  Die  Ubertragungsfunk- 
tion  des  offenen  Kreises  in  diesem  Fall  lautet 


(1-0,15- s).(HTr.s) 
F0(s)  *  k«  (1+0,1$. s)*s 

und  fur  den  Frequenzgang  gilt 


(7.57) 


F0(^) 


0,15.(1+0,15‘T  *w2)  -  T  +  0,15 

k, _ L _ L - 

(1+0,15 

1  +  0,15.Ir.«2  +  0,15*w2. (T^-0,15) 
&j.(1+0,152.wZ) 


-  j.fc. 


(7.58) 
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a)  Wahlt  man  die  Zeitkonstante  Tr  >  0,15/2  aus,  dann  nimmt  die  zu  (7.58)  geho- 
rende  Ortskurve  die  in  Bild  7.8a  gezeigte  Form  an. 


Bild  7.8:  Ortskurve  mit  einem  PD-Regler 


Nur  wenn  die  Bedingung 

k  <  t;  b™-  kr  <  (7-59) 

erfullt  ist,  ist  der  Regelkreis  stabil. 

b)  Fur  Tr  <  0,15/2  hat  die  Ortskurve  die  in  Bild  7.8b  gezeigte  Gestalt.  Die 
Freqenz  laBt  sich  durch 


1-u2-(0,152-0,3-T  ) 

n  =  -  k - ..  r..  ,  o 

w- (1+0,15  •</) 


(7.60) 


berechnen.  Es  ist 


Bei  dieser  Frequenz  ist 


£k  =  -  k-(0,15-Tr) 


(7.61) 
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Went*  die  Bedingung  £k  >  -  1*  also 


k  < 


_ L__ 

0.15-Tr 


{7.62} 


erfullt  ist,  ist  das  System  stabil.  Nun  wird  Z(s)  -  1/s  gesetzt.  Dann  lau- 
tet  die  Laplace-Transformierte  des  Istwertes 


v;<s)  =  Gz(s).Z{s) 


0,lS*s  +  1 


0,15* (1-T  *k}*s4  +  (1-0, 15*k+T  *k}*s  +  k 


(7.63} 


Fur  Tr  =  0,1  lautet  das  Integral  (7.33) 


1  +  0,05*k 


¥**  l  *  VjVW’R 

J(k)  =  - - j - 3  . 

1  k  -  0,!5*k^  +  0,005* kJ 
Lost  man  die  Gleichung 


(7.64} 


dJ|k)  R  -0,0005-k3  -  0,0075‘k2  +  0,3-k  -  1 


dk 


(k-0,15*k2+0,0G5*k3}2 


(7.65} 


nach  k  auf,  erhalt  man  fur  k  den  Wert  3,78.  Die  Ver starkung  k  kann  die  Sta¬ 
bil  itatsbedingung  {7.59}  erfullen.  Setzt  man  k  und  Tf  in  Y^(s)  ein,  so 
folgt 


Y'(s}  -  k, - -  .  (7-66} 

3  4  0,093*  +  0,811*s  +  3,78 

Fuhrt  man  nun  die  Rucktrans format! on  aus,  so  bekommt  man 

y'(t)  =  l,80*k4*exp(-4,36*t) *sin(4,642*t+l,109} .  (7.67} 

Nach  Bild  7,4  kann  die  Kameraposition  p?(t}  berechnet  werden.  Es  ist 


P#(t)  =y^(t)/k4  -  z(t} 


(7.68a} 
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Setzt  man  «  1  und  z(t)  -  1  in  p'(t)  ein,  so  ergibt  sich 


Bild  7.9:  Verlauf  der  Funktion  P'(t). 

Die  Kurve  3  in  Bild  7.7  zeigt  die  Storantwort  y'(t)  von  (7.67).  An  diesem  Er- 

a 

gebnis  erkennt  man  zweierlei.  Zum  einen  ist  die  Dampfung  des  Regelkreises  ge- 
geniiber  dem  Regel kreis  mit  PI-Regler  erhoht.  Das  System  braucht  nur  kurze 
Zeit,  um  den  Istwert  y^{ t)  =  0  zu  erreichen.  Zum  anderen  verursacht  der  D-An- 
teil  des  Reglers  den  starken  Stelleingriff  zu  Beginn  des  Regel vorgangs.  Des- 
halb  wird  die  Kamera  am  Anfang  des  Regel vorgangs  eine  sprungformige  Bewegung 
durchfuhren  (Kurve  3  in  Bild  7.9).  Durch  diese  Bewegung  ist  die  Kamera  weiter 
von  der  besten  Fokussierungsposition  entfernt.  Das  Ergebnis  ist  unerwunscht. 

3)  PID-Reoler 

Nun  erfolgt  die  weitere  Untersuchung  des  gleichen  Problems  mit  einem  PID-Reg- 
ler.  Der  PID-Regler  eignet  sich  fur  besonders  schwierige  und  schnelle  Regelun- 
gen.  Er  vereinigt  die  rasche  Wirkung  des  P-Reglers,  die  stabil isierende  Wir- 
kung  des  D-Anteils  und  den  I-Anteil,  der  solange  eingreift,  bis  die  Regelab- 
weichung  Null  wird.  Die  Ubertragungsfunktion  des  PID-Reglers  gilt  im  idealen 
Fall 


Gr(s)  -  kr 


(l+Trl.s)-(l+Tr2-s) 


s 


(7.69) 
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Jetzt  sind  die  freien  Reglerparameter  kr*  Trl»  Tf2  zu  wahlen.  Die 
Ubertragungsfunktion  des  offenen  Regel kreises  Gg( s)  lautet 


(l-0t15-s)-O+Trl'S).(UTr2Q 

s2*{1+0,15*s) 


(7.70) 


Dabei  1st  k  gleich  k^/400.  Es  wird  im  Sinne  der  Kompensation  gesetzt 


T 


rl 


0,15 


(7.71) 


und  (7.70)  reduziert  sich  damit  auf 


(I-0,15-s).{l+T  2*s) 

60(s)  =  ** - p - — -  * 

Die  charakteristische  Glei chung  des  geschlossenen  Regel kreises  ist 


(7.72) 


(l-0,15*k*Tr2).X2  +  (Tr2-0,15).k.A  +  k  =  0  ,  (7,73) 

Die  notwendigen  und  hinreichenden  Stabilitatsbedingungen  fur  den  Regelkreis 
sind  dann 


tr2  >  0,15 
0  <  k  < 


400 


r  0,15*Tr2*k4 


(7.74) 


Die  Parameter  kr  und  Tf2  werden  erneut  mit  Hilfe  des  Verfahrens  der  Parameter- 
optimierung  bestimmt,  Dazu  mu8  die  Laplace-Transformierte  des  Istwertes  Y'(s) 
bekannt  sein,  Wenn  Z(s)  =  1/s  ist,  folgt 


Yg(s)  =  Gz(s).Z(s) 

_ _ V! _ 

(l-0,15*Tr2*k)*s2  +  (!r2-0,15}.k.s  +  k 


(7.75) 
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Das  Integral  (7.33)  ergibt  sich  nach  kurzer  Rechnung 


J(k,Tr2)  “  2-k- (Tr2-o; 15) - (1-0, 15-Tr2-k)  * 

Die  optimal en  Parameter  k  und  konnen  aus  dem  Gleichungssystem 

r*](kJr2)  kj  -Tr2  +  0,15  +  0,3-T^-k  -  2-0,152-Tr2-k 
3I<  "  2  [MTr2-0,lS).(l-°,15.Tr2.k)]2 

W(k,Tr2)  k4  -  k  +  0,3  Tr2-k2  -  0,15Z-k2 
a-Tr2  2  [k-(Tr2-0,15).(l-0,15-Tr2-k)]2  " 

berechnet  werden.  Nach  einfacher  Rechnung  ergibt  sich 


k  *  1/0,15* 
Tr2  -  0,15 


Das  Ergebnis  ist  unerwunscht,  da  der  Regelkreis  sich  in  dem  kritischen  Stabi- 
1  itatszustand  befindet.  Setzt  man  k  und  in  Y^(s)  ein,  dann  erhalt  man 


Y;(s)  =  0 , 1 5  - k4 - s  . 


Die  Riicktransformation  von  Y'(s)  ergibt 

a 


y;(t)  =  0,i5*-k4-S{t)  . 


Das  ist  in  der  Praxis  nicht  real isierbar.  In  einem  weiteren  Versuch  wird  die 
Zeitkonstante  Tr2  auf  0,3  gesetzt.  Mi t  Hilfe  des  Verfahrens  der  Parameteropti  - 
mierung  erhalt  man  sofort 


(7-81) 
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Die  Parameter  k  und  konnen  aueh  die  Stabil itatsbedingung  (7.74)  erfullen. 
Die  Laplace-Transformierte  des  Istwertes  lautet  In  diesem  Fall 


V;(s} 


2-ys 

s2  +  3,333*s  +  22,222 


(7.82) 


Dureh  Riicktransformation  In  den  Zeitbereich  erhalt  man  unmittelbar 


y*(t)  =  2, 138* k^* exp (-1, 667* t) *  cos (4, 41 -1+0,362)  .  (7.83) 


Die  Kurve  4  in  Bild  7.7  zeigt  den  Verlauf  von  (7,83).  Weil  der  PID-Regler  auch 
einen  I-Anteil  enthalt,  wird  der  Regelkreis  noch  nicht  geniigend  gedampft.  Au- 
Berdem  verursaeht  der  D-Anteil  des  Reglers  den  starken  Stelleingriff  zu  Beginn 
des  Regel vorgangs.  Am  Anfang  des  Regel vorgangs  fuhrt  die  Kamera  auch  eine 
sprungformige  Bewegung  durch  (Kurve  4  in  Bild  7.9). 


4)  P-Regler 

SchlieBlich  wird  untersucht,  die  Strecke  mit  einem  einfachen  P-Regler  zu  re¬ 
gain,  Der  Grund  dafur  1st,  daB  der  Vorwartszweig  des  Regelkreises  in  Bild  7.4 
ein  Integrationsgl led  enthalt.  Der  P-Regler  gewahrleistet  in  diesem  Fall  eine 
vollige  Storungsausregelung,  da  die  StorgroBe  erst  hinter  dem  I-61ied  in  der 
Strecke  eingreift.  Die  Ubertragungsfunktion  des  P-Reglers  ist 

Gr(s)  «  kr  .  (7.84) 

Setzt  man  (7.84)  in  (7.16)  ein,  ergibt  sich 


kA*s* (1+60, 15*s) 

Gz($)  =  - ^2 - 

2  G,15*s2  +  (1-D, 15*k) -s  +  k 


(7.85) 


Es  wird  jetzt  die  Stabil i tat  des  Regelkreises  untersucht.  Die  charakteristi- 
sche  Gleichung  von  (7,85)  ist 


,2  x  1  -  0,15-k 
A  +  0,15 


•A  +  k  =  0 


(7.86) 
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Aus  der  notwendigen  und  hlnreichenden  StabilitStsbedingung  folgt 


1  -  0,15-k 
0,15 


>  0 


(7.87) 


oder 


k  <  o!l5  b2W-  kr  <  0,15^k4 


und  k  -  kr-k4/400  >  0,  da  k4  >  0  ist,  muB 


kr  >  0 


sein,  was  zusammen  mit  (7.88a)  und  (7.88b)  fur  kr  den  Wertebereich 


0  <  k  < 


400 


>  v  0,15-k4 

ergibt.  Wenn  eine  sprungartige  Storung  Z(s)  -  1/s  auftritt,  ist  es 


(7.88a) 


(7.88b) 


(7.88c) 


V;($)  *  Gz(s).Z(s) 


k4- (1+0, 15- s) 

0,15-s2  +  (l-0,15-k)*s  +  k 


(7.89) 


(7.88c)  bestimmt  den  Wertebereich  von  kr.  Weil  der  Regler  nur  einen  wahlbaren 
Parameter  hat,  spielt  kr  die  entscheidende  Rolle  fur  das  Zeitverhalten  des 
Regelkreises.  Urn  den  konkreten  Wert  von  kf  zu  bekommen,  wird  das  Verfahren  der 
Parameteroptimierung  nochmal  eingesetzt.  Das  Integral  J(k)  in  diesem  Fall 
'1  autet 


J(kr) 


(1+0,15-k) 

(k-0,15-k2) 


Die  Bestimmungsgleichung  fur  k  folgt 


dJ(k)  k4  0, 152 

dk  2  * 


jr  ±  0,3-k  -  1 


( k-0, 15 - k2)2 


-  0 


(7.90) 


(7.91) 
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test  man  (Hess  Gleichung  auf,  so  ergibt  sich 


k 


1 

0,36 


bzw,  kf 


400 

0,36-k4 


(7.92) 


Oer  Parameter  kf  kann  die  Stabilititsbedingung  (7,88c)  erfullen.  Setzt  man 

k,  -  1/0,36  In  Y'{s}  ein,  so  folgt 
r  o 


y;(*) 


k4-(0,15-s+l) 

0,15*s2  +  0,583*s  +  2,778 


(7.93) 


Ole  Systemantwort  auf  z(t)  *  o(t)  1st  dann 


y^(t)  -  l,585*k^*exp(-l,95*t)*sin(3,84*t+0»683)  .  (7,94) 

Kurve  1  In  Slid  7.7  1st  der  Verlauf  von  (7.94).  Einerseits  1st  der  Regelkrels 
genugend  gedampft,  andererselts  hat  die  Kamera  zu  Beginn  des  Regelvorgangs 
kelne  sprungformige  Bewegung  durchgefiihrt.  AuBerdem  1st  der  P-Regler  in  der 
Praxis  elnfach  zu  realisieren.  Deshalb  wird  der  P-Regler  im  Regelkrels  zur 
Erhaltung  der  besten  Fokusslerungsposition  verwendet. 

7.5  Zgltverhalten 

In  dlesem  Abschnltt  wird  die  Varianz  der  Grauwerte  als  Fokussierungsfunktion 
benutzt.  Bild  7.10,  Bild  7.11  und  Bild  7.12  zeigen  das  Zeitverhalten  des  Re- 
gelkreises  zur  Erreichung  der  besten  Fokussierung  durch  Experimente.  In  den 
Experimenten  ist  das  Gbjekt  unbeweglich  und  die  beste  Fokusslerungsposition 
liegt  In  der  Position  p*  -  150  mm.  Die  Zeit  fur  jeden  Schritt  umfaSt  die  Zeit 
fOr  die  Berechnung  der  Fokussierungsfunktion  und  die  Zeit  fur  die  Bewegung  der 
kamera.  Die  max.  Bewegungsgeschwindigkeit  der  Kamera  betragt  20  mm/Sekunde, 

Ole  Zeit  fur  die  Berechnung  der  Varianz  dauert  0,24  Sekunden.  Wie  in 
Abschnltt  7,2  geschildert,  wird  die  SchrittgroSe  der  kamera  vor  dem  Fokussie- 
rungsprozeB  bestimmt;  deshalb  ist  die  konstante  AF  der  einzige  Faktor  zur  Be- 
einflussung  des  Zeitverhaltens  des  Regel kreises, 

Bild  7.10a  und  b  sind  der  Verlauf  der  Varainz  VAR(t)  und  Verlauf  der  Kamera- 
posltion  p*(t)  fOr  die  konstante  AF  gleich  1.  In  diesem  Fall  ist  die  beste 
Fokussierungsposition  problemlos  gefunden. 
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Verlauf  der  Zeitfunktion  VAR(t) , 
Verlauf  der  Zeitfunktion  p'(t). 


In  Bi 1 d  7.10a  befindet  sich  die  Kamera  in  den  ersten  7  Sekunden  im  unwirksamen 
Bereich.  Die  Varianz  nimmt  in  diesem  Bereich  nicht  monoton  zu,  sie  verandert 
sich  nur  wenig.  Es  gibt  keinen  Fall,  in  dem  die  Bedingung  (7.5)  erfullt  wird. 
Die  Kamera  wird  bis  zum  Punkt  A,  wo  die  Bedingung  (7.5)  erfullt  ist,  fahren. 

Im  Punkt  A  hat  die  Kamera  die  beste  Fokussierungsposition  uberschritten.  Des- 
halb  muB  die  Kamera  zuruckfahren.  In  der  zweiten  Phase  fahrt  die  Kamera  mit 
der  SchrittgroBe  5  mm  bis  zum  Punkt  B,  wo  die  Bedingung  (7.4)  erfullt  ist.  In 
der  letzten  Phase  fahrt  die  Kamera  in  umgekehrter  Richtung  mit  der  Schritt¬ 
groBe  1  mm.  Wenn  die  Bedingung  (7.4)  wieder  erfullt  ist,  fahrt  die  Kamera  1  mm 
zuruck.  Die  Position  p'  -  150  mm  ist  der  stationare  Endwert  des  Istwertes  vom 
Regel kreis. 


-  156  - 


Venn  die  Konstante  AF  zu  klein  1st,  wlrd  die  Kamera  elne  falsche  Position  als 
beste  Fokussierungsposition  finden.  Bild  7.11  zeigt  das  Zeitverhalten  des  Re¬ 
gel  kreises  fur  AF  -  0,1.  Wegen  des  Einflusses  des  Bildrauschens  hat  die  Va- 
rianz  In  der  Position  p'  -  42  m  ein  lokales  Maximum.  In  der  Position  p*  »  50 
mm  1st  FF  -  FFR  x  -  -  0,27  <  -  0,1.  Oeshalb  1st  der  Computer  davon  uberzeugt, 
da6  die  Kamera  die  beste  Fokussierungsposition  uberschritten  hat.  Am  Ende  des 
Fokussierungsprozesses  wird  die  Position  des  lokalen  Maximums  als  die  beste 
Fokussierungsposition  betrachtet.  Dieser  Regel kreis  ist  zwar  stabil,  sein  sta- 
tionarer  Endwert  ist  aber  falsch. 


Bild  7.11;  a)  Verlauf  der  Zeitfunktion  VAR(t), 
b)  Verlauf  der  Zeitfunktion  p# (t) . 

Henn  die  Konstante  AF  zu  groft  ist,  1st  der  Regelkreis  instabil.  Das  kann  man 
an  Bild  7.12  erkennen. 
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t>) 

Bild  7.12:  a)  Verlauf  der  Zeitfunktion  VAR(t) , 
b)  Verlauf  der  Zeitfunktion  p'(t). 


Fur  AF  *  3  gibt  es  im  ganzen  Arbeitsbereich  keine  Position,  wo  die  Bedingung 
FFn  -  FFn  l  <  -  3  erfiillt  werden  kann.  Die  Kamera  wird  bis  zum  Rand  des 
Arbeitsbereiches  fahren.  Deshalb  ist  der  Regelkreis  instabil. 

Das  Zeitverhalten  vom  Regelkreis  zur  Erhaltung  der  besten  Fokussierung  wird 
zuerst  theoretisch  analysiert.  Dasselbe  Zeitverhalten  wird  auch  experimentell 
gemessen.  In  dem  Experiment  wird  das  Muster  Honig  als  Objekt  benutzt.  Die  Kon- 
stante  k^  vom  Muster  Honig  ist  ca.  0,115.  Wie  es  im  Abschnitt  7.4  geschildert 
ist,  wird  ein  P-Regler  im  Regelkreis  verwendet.  Setzt  man  k4  -  0,115  und 
k  -  1/0,36  in  (7.85)  ein,  so  folgt 
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G M  «  MULldMLlill 


(7.95) 


9,15»s  +  0,583-s  +  2,777 
Wenn  die  St6rgr68e  z(t)  -  10*o(t)  1st,  also  Z(s)  -  10/s,  dann  erhSlt  man 


v;t.)  •  e  (s)-z(s)  - 

a  z  s‘  +  3,89-s  +  18,52 

Die  ROcktrans format ion  von  ¥'{s)  ergibt 


(7-96) 


y'(t)  -  1*823- exp(-l, 95- t).sin(3,84.t+0, 683) 

fi 


(7.97) 


MM  Uli  a)  Funktion  y'(t). 

b)  Funktion  p#(t). 
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Die  Laplace-Transformation  der  Kamerapositon  p'(t)  laBt  sich  au$  Bild  7.4 
berechnen.  Es  ist 


p'(s).  — i  . 

+  3,89- s  +  18,52  5 
Der  Verlauf  von  p'(t)  ist  dann 

p'(t)  =  -  10  +  15,85-exp(-l,95*t) • sin (3,84- t+0, 836) 


(7.98) 


(7.99) 


Die  Funktionen  von  y'(t)  und  p'(t)  werden  in  Bild  7.13  (Kurve  1)  dargestellt. 

Q 

Zu  Beginn  des  Regelvorgangs  wird  der  Istwert  y'(t)  weiter  zunehmen  und  die 
Kamera  fahrt  in  die  falsche  Richtung.  Das  steht  nicht  mit  dem  Ergebnis  des 
realen  Regelkreises  im  Einklang.  Der  Grund  ist,  wenn  das  Totzeitglied  durch 
eine  Pade-Approximation  erster  Ordnung  angenahert  ist,  wird  ein  Fehler  er- 
zeugt.  Den  EinfluB  dieses  Fehlers  kann  man  durch  den  Vergleich  der  Kurve  1  und 
Kurve  2  in  Bild  7.13  deutlich  bemerken.  Kurve  2  ist  das  Zeitverhalten  des  Re¬ 
gelkreises,  wenn  das  Totzeitglied  nicht  angenahert  wird  (exakte  Losung).  Kurve 
2  ist  mit  Hilfe  der  digitalen  Simulation  des  Regelkreises  in  Bild  7.14  ermit- 
telt  worden. 


Bild  7.14:  Linearer  Regelkreis  mit  Totzeit. 

Der  Algorithmus  der  Simulation  ist  das  Runge-Kutta-Verfahren  4.  Ordnung.  Dafiir 
muB  die  Differentialgleichung  des  Regelkreises  zuerst  in  Zustandsform 
umgeformt  werden.  Durch  Einfiihren  von  geeigneten  Zustandsvariablen 

Xl(t)  =  p'(t)  =  8,696.y;(t)  -  z(t) 
x2(t)  =  400 * Xj (t)  =  -  kr-y;(t-0,3) 


(7.100) 
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kann  man  das  Zustandsgleichungssystem  von  Si Id  7.14  bilden.  Es  1st 
=  4§0'x2^ 

(7.101) 

x2(t)  =  -  Q.llS-k^Cx^t-O.S)  +  z(t-Q,3)] 
mit  x^O)  =  0  und  x2(0)  =  0.  Die  Funktionen  y*(t)  und  p'(t)  lassen  sich  zu 


y'(t)  =  0,115* [XjCt)  +  z(t)]  ,  (7  102) 
.p'W-Xjtt) 

bestimmen.  Das  Ergebnis  der  Simulation  1st  aueh  in  Bild  7.13  gezeigt.  Da  die 
Ubertragungsfunktion  der  Interfacekarte  als  Totzeitglied  bleibt,  bewegt  sich 
die  Kamera  in  den  ersten  0,3  Sekunden  nicht.  Nach  0,3  Skunden  wird  die  Kamera 
direkt  zur  besten  Fokussierungsposition  fahren. 


Die  Kurve  ffir  t  <  0  stellt  den  Zustand  der  besten  Fokussierung  dar.  Bei  der 
besten  Fokussierung  liegt  die  Kamera  in  der  Position  p'=  0  und  der  Istwert  des 
Regelkreises  ist  Null.  Zum  Zeitpunkt  t  =  0  wird  eine  Stoning  z(t)  =  10  plotz- 
lich  aufgegeben.  Wegen  der  Tragheit  des  Systems  kann  die  Kamera  nicht  sofort 
darauf  reagieren.  Der  Istwert  ist  von  0  auf  1,15  gestiegen.  Die  Eingabe  am 
Regler  ist  -  1,15.  Unter  der  Auswirkung  von  diesem  Signal  gibt  der  Regler  ein 
Signal  aus.  Die  Kamera  fahrt  zuruck,  anschlieBend  wird  die  Kamera  10  mm  zu- 
ruckgefahren . 

Durch  die  theoretische  Analyse  kann  man  bemerken,  daS  mit  Hilfe  des  einfachen 
p.Reglers  a11e  Anforderungen  am  Regelkreis  erfullt  warden  konnen.  In  der 
Praxis  ist  der  Kontrollalgorithmus  des  Reglers  ahnlich  wie  beim  P-Regler,  al- 
lerdings  ist  die  SchrittgroBe  der  Kamera  veranderbar,  Sie  ist  abangig  vom  Ist¬ 
wert  y'.  Am  Anfang  des  Fokussierungsprozesses  ist  die  Kamera  normalerweise 
weit  von  der  besten  Fokussierungsposition  entfernt.  Der  Istwert  ist  deshalb 
ziemlich  groB.  Deshalb  wird  die  Kamera  mit  groBerer  SchrittgroBe  gefahren.  In 
der  Nahe  der  besten  Fokussierungsposition  ist  der  Istwert  y'(t)  klein.  In  die- 
ser  Situation  fahrt  die  Kamera  mit  kleiner  SchrittgroBe. 
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Kurve  3  in  Bild  7.13a  und  b  sind  die  experimentellen  Ergebnisse  von  y^(t)  und 

p'(t).  Am  Anfang  fahrt  die  Kamera  mit  der  grBBeren  SchrittgroBe  5  mm  zurQck. 

Wenn  der  Istwert  y'(t)  sich  verkleinert,  wird  die  SchrittgroBe  auf  1  mm 

Q 

gesetzt.  Der  Endwert  von  p'(t)  1st  -  10  mm. 

Durch  den  Vergleich  der  Kurven  in  Bild  7.13a  und  b  kann  man  bemerken,  daB  die 

Ergebnisse  des  Zeitverhaltens  zwischen  der  theoretischen  Analyse  und  den  ex- 

perimentellen  Ergebnissen  sehr  ahnlich  sind.  Es  gibt  aber  auch  Unterschiede. 

Die  Ursache  dafur  ist  vielfaltig  und  zwar: 

1.  Die  Ubertragungsfunktion  des  Bildverarbeitungssystems  ist  mit  einer  kon- 
stanten  Funktion  naherungsweise  dargestellt.  Die  Konstante  k4  ist  von  0b- 
jekt  zu  Objekt  unterschiedl ich. 

2.  Die  Ubertragungsfunktion  des  Schrittmotors  ist  als  Verstarker  modelliert. 

In  Wirklichkeit  ist  der  Schrittmotor  in  seinem  Aufbau  und  seiner 
Wirkungsweise  mit  einem  biirstenlosen  Gleichstrommotor  vergleichbar. 

3.  Die  Ubertragungsfunktion  der  Interfacekarte  ist  ein  Totzeitgl ied.  Durch  die 
Rational isierung  wird  dieses  Totzeitgl ied  als  die  Pade-Approximation  erster 
Ordnung  angen&hert. 

4.  Die  Herleitung  der  Ubertragungsfunktion  vom  Bildverarbeitungssystem  hat  die 
Rechenzeit  der  Fokussierungsfunktion  nicht  berOcksichtigt. 
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8.  Zusammenfassung 

Um  elne  Produktion  von  81 Idem  mit  hochster  Quail  tat  zu  bekommen,  1st  eine 
eindeutige  Definition  des  Optimalfokus  erforderlich,  In  der  vorliegenden  Ar¬ 
beit  wird  zuerst  die  Bedeutung  der  automat Ischen  Fokussierung  erlautert  und  es 
wird  auf  die  Geschichte  der  automatischen  Fokusslerung  zuruckgeblickt 
(Kapltel  1). 

In  Kapltel  2  wlrd  das  Fokusslerungsprlnzlp  des  menschllchen  Auges  erklart, 
Elnlge  fur  die  Fokusslerung  wichtlge  Begrlffe  werden  aufgestellt  und  disku- 
tlert.  Die  optlsche  Obertragungsfunktion  (O0f)  wlrd  von  der  Wellenoptlk  und 
der  geometrlschen  Optik  hergeleitet,  Um  die  Bildqualitat  zu  beurteilen*  werden 
insgesamt  4  Kriterien  aufgestellt. 

Die  Grundidee  der  automatischen  Fokussierung  fur  die  Kamera  ist  die  Suche  nach 
den  Fokussierungsfunktionen.  Aus  diesem  Grund  werden  einige  Anf order ungen,  die 
an  Fokussierungsfunktionen  gestellt  werden,  vorgestellt.  Insgesamt  wlrd  das 
automatische  Fokussierungsverfahren  mit  8  verschiedenen  Fokussierungsfunktio¬ 
nen  reallsiert  {Kapltel  3).  Die  Fokussierungsprinzipien  von  ihnen  werden  in 
Kapltel  4  genau  analysiert. 

Zur  Beurteilung  der  Fokussierungsfunktionen  werden  Experimente  durchgefiihrt 
und  die  Kurven  der  Fokussierungsfunktionen  in  verschiedenen  Situationen  gemes- 
sen  und  verglichen.  Ourch  die  experimentellen  Ergebnisse  werden  die  Vorteile 
und  die  Nachteile  der  verschiedenen  Fokussierungsfunktionen  herausgearbeitet. 

In  Kapltel  5  wlrd  das  Problem  der  Fokussierung  von  Bildausschnitten  untersucht 
und  die  Grundidee  zur  Losung  dieses  Problems  erlautert.  Die  Auswirkungen  des 
Bildrauschens  auf  die  Fokussierungsfunktionen  werden  ebenfalls  untersucht. 

Zwei  Methoden  zur  Unterdriickung  der  Auswirkungen  des  Bildrauschens  werden  dis- 
kutiert  und  realisiert.  Am  Ende  von  Kapltel  5  wird  die  Zoom-Auswirkung  der 
Kamera  untersucht.  Ein  Algorithmus  zur  Kompensierung  der  Zoom-Auswirkung  wird 
vorgestellt. 

Die  Fokussierungsfunktion  ist  ungeeignet  zur  Fokussierung  von  beweglichen  Ob- 
dekten.  Deshalb  wird  ein  neues  Verfahren  zur  Fokussierung  von  beweglichen  Ob- 
dekten  entwickelt.  Das  Verfahren  zur  Fokussierung  von  beweglichen  Objekten 
wird  mit  Hilfe  eines  Lasergerates  realisiert.  Die  Objektweite  des  Objektes  als 
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die  Funktion  der  Bildkoordinaten  vom  Laserfleck  wird  hergeleitet.  Durch  die 
sogenannte  Kamerakalibrierung  werden  die  Systemkoeffizienten  bestimmt.  Der  $y- 
stemfehler  wird  durch  Experimente  und  durch  eine  theoretische  Analyse  unter- 
sucht  (Kapitel  6). 

Zur  Entwickl ung  der  automatischen  Fokussierung  wird  das  Bildverarbeitungs- 
system  Max  Vision  AT-1  benutzt.  Um  Fokussierungsregelkreise  zu  entwerfen,  wird 
der  FokussierungsprozeB  in  zwei  Phasen  gemaB  der  gestellten  Aufgabenstellung 
eingeteilt,  namlich  die  Erreichung  der  besten  Fokussierung  und  die  Erhaltung 
der  besten  Fokussierung.  Fur  beide  Phasen  wird  jeweils  ein  mathematisches  Mo- 
dell  der  Fokussierungsregelkreise  vorgestellt.  Die  Obertragungsfunktion  des 
Fokussierungsregel krei ses  fQr  die  Erhaltung  der  besten  Fokussierung  kann  durch 
Linearisierung  des  Obertragungsgl iedes  Bildverarbeitungssystem  und  Rational i- 
sierung  des  Totzeitgl iedes  erhalten  werden.  GemaB  dieser  Obertragungsfunktion 
wird  der  Regler  des  Fokussierungsregel kreises  entworfen.  SchlieBlich  wird  das 
Zeitverhalten  des  Systems  durch  Experimente  und  eine  theoretische  Analyse  er¬ 
halten  (Kap.  7). 

Ausblick  und  kritische  Wurdigung 

Aufbauend  auf  dem  derzeitigen  Stand  der  Untersuchungen  sollten  weiterfuhrende 
Arbeiten  an  folgenden  Punkten  ansetzen. 

1)  Um  die  Zoom-Auswirkung  der  Kamera  zu  vermeiden,  sollte  die  automatische 
Fokussierung  durch  die  Veranderung  der  Brennweite  der  Kamera  erreicht  wer¬ 
den. 

1)  Das  Verfahren  der  Fokussierung  von  Bildausschnitten  sollte  weiter 
untersucht  werden,  damit  die  Tiefeninformation  einer  Szene  aus 
zweidimensionalen  Bildern  extrahiert  werden  kann. 

3)  Der  in  Kapitel  6  geschilderte  Algorithmus  zur  direkten  Berechnung  der  Ob- 
jektweite  mit  Hilfe  eines  Lasergerates  sollte  weiterentwickelt  werden,  um 
ein  Robotersichtsystem  aufzubauen. 

In  der  vorliegenden  Arbeit  werden  verschiedene  Verfahren  zur  automatischen  Fo¬ 
kussierung  des  Objektes  untersucht.  Durch  die  theoretische  Analyse  wird  die 
Frequenzreaktion  des  defokalen  optischen  Systems  geklart.  Viele  interessante 
Ergebnisse  sind  durch  Experimente  erzielt  worden. 
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